Palmeira

[Palmeira%20dos%20Índios][bsummary]

Viagens

[Viagems][bleft]

Vídeos

[Vídeos][twocolumns]

Curiosidades

[Curiosidades][bsummary]

Você pode estar trabalhando para o The New York Times sem perceber

Muito provavelmente você já se deparou com uma mensagem parecida com “Prove que você não é um robô”, sempre no final de um formulário ao se cadastrar em algum serviço na internet. O que não deve ter notado é que toda vez que você decifra aquelas letras borradas e destorcidas, esta ajudando a digitalizar o acervo do The New York Times.

Os captchas são uma medida de segurança muito comum na rede mundial de computadores, podemos os encontrar em grandes serviços como no Google ou no Facebook, a sigla em inglês significa Completely Automated Public Turing test to tell Computers and Humans Apart (ou traduzindo livremente, Teste de Turing Público Completamente Automatizado para Diferenciar Computadores e Humanos). O mais famoso atualmente é o ReCaptcha, que foi comprado pelo Google que faz dele um digitalizador de livros.

O captcha foi criado para proteger sites na internet de bots maliciosos. A detentora da patente é a universidade Carnegie Mellon, dos Estados Unidos, que a desenvolveu no início dos anos 2000. A tecnologia consiste em usar a incapacidade dos computadores de decifrar caracteres distorcidos dessa forma o sistema pode assim distinguir um computador de um humano.

São 200 milhões de captchas resolvidos diariamente, com isso Luis von Ahn, cientista criador da tecnologia, fez a seguinte pergunta: por que não aproveitar esse processamento do cérebro e usá-lo para algo útil, como ajudar na “leitura” de palavras e caracteres de livros?

Os OCRs (Optical Character Recognition, ou Reconhecimento Ótico de Caracteres), são usados para decifrar o texto de livros antigos, mas não são perfeitos, sendo incapazes de solucionar 20% das palavras presentes em folhas rasgadas ou amareladas. É ai que entra o captcha, que baseado no trabalho humano decifra com precisão de 99%.

Duas palavras são apresentadas no ReCaptcha, uma o OCR já conhece, a outra será decifrada pelo internauta. Se o usuário errar a palavra já conhecida pelo OCR, o captcha mostra um resultado negativo, caso acerte, o OCR entende que se a palavra conhecida foi digitada corretamente, deve acertar também a não decifrada, sendo que não é possível distinguir a palavra conhecida da não decifrada. Dessa forma é possível determinar se o usuário é um robô ou não, e ainda armazenar novas palavras no serviço. 

O ReCaptcha é utilizado desde 2009 para digitalizar os artigos do The New York Times, além de livros do acervo do Google Books.

REFERÊNCIAS:
techtudo.com.br/ (Acesso em 13 de outubro de 2017)

Nenhum comentário:

Vídeos da Web