junho 1, 2003 | In: Baguete

A web semântica

Embora este assunto não seja novo, se faz necessário e relevante. A abundância de informações irrelevantes na Internet tem se tornado um problema desde que seu uso massificou, a partir de 1998.

Encontrar informações relevantes não é tarefa fácil. E a culpa normalmente é do pobre HTML, que nada fez para nos ajudar em suas pobres tags. A bem da verdade é que desde o SGML, passando pelo HTML e mais recentemente (embora a idade temporal não seja recente), o XML, que ja é um padrão relevante para troca de informações (não, o XML não substitui o HTML), é preciso que nós nos forcemos a identificar corretamente o conteúdo que geramos, em casa, no trabalho, na escola e no meio acadêmico. As tags HTML são muito limitadas nesse sentido. Elas apenas descrevem como a página deve ser exibida e não oferecem nenhuma descrição dos dados contidos em si.

Quando documentos são indexados, nos é então permitido procurar por eles. O problema é que pessoas procuram por coisas iguais de maneiras diferentes, e procuram por coisas diferentes de maneira igual. A chave é mais ou menos essa, ao invés de pensar como informação compreensível aos humanos, devemos pensar naquilo que as máquinas entenderiam.

Algo como “Machine-understandable Information”, de acordo com o mestre Tim Berners-Lee. É preciso então criar categorias semânticas para descrever os dados contidos nas páginas e uma linguagem que façam sentido para as máquinas.

Aí entramos em outro estágio, das ontologias e dos agentes. As ontologias (conjuntos de conceitos em lógica, sobre determinada área de conhecimento) se encarregarão de criar os vocabulários necessários ao funcionamento dos agentes (monstrinhos que farão o trabalho para nós, assim como no Matrix).

As ontologias criarão os conceitos e estabelecerão regras lógicas, para se interpretar o significado das informações. E os agentes, peças de software que funcionarão como serviços dispersos e automáticos, precisarão destas ontologias para nos servir. Neste caso, de informações realmente relevantes.

O caminho já vem sendo trilhado, e só não é mais longo porque já passou bastante tempo. Mas ainda serão necessárias novas tecnologias para suprir atuais carências e deficiências no que temos disponível hoje.

O W3C trabalha dia e noite nisso, seria bom você reservar um tempo para ajudar.

Comment Form

Twitter Updates

    Flickr


    By Erik Rasmussen