W3C Escritório Brasil - Blog

Dado pra todo lado!

Open Data é um tema que está há muito tempo na crista da onda. Faça uma busca pelo tema no Google e você vai encontrar uma infinidade de notícias impressionantes e fresquinhas sobre o assunto, deixando a todos boquiabertos com as novas possibilidades de uso daquilo que os seres humanos mais produzem depois de lixo: dados.

No lançamento do W3C Brasil, em 2008, o principal tema era este mesmo: dados, só que abertos e pra impulsionar o governo a melhorar as suas práticas de e-gov. De lá até aqui destravamos alguns badges: temos um site de dados do governo que nasceu de modo colaborativo, um portal que é filho único na América Latina sobre o tema, ajudamos a formar comunidades e também a construir publicações em parceria com várias entidades importantes, da transparência e similares, estamos promovendo abertura de dados em várias instituições, visando mostrar na prática uma idéia que também circula bastante: a de que dados precisam pertencer à uma cadeia de valor para gerar valor econômico.

Além disso, gostamos muito de eventos sobre o tema e também temos o costume de promovê-los, assim como apoiamos (boas) iniciativas de uso de tecnologias padronizadas para dados que agregam valor econômico, social e porque não, ao camarote.

Acontece que o mundo hiperconectou-se exponencialmente nestes últimos cinco anos. Culpa dos dispositivos que, de tão pequenos, caminham junto conosco: smartphones e tablets.

Eles funcionam como pequenos coletores de dados, nos cultivando como boas sementes de informação para um mundo mais colaborativo (será?). Isso é só o começo de um sistema complexo de redes de coleta e uso de dados que deve existir para melhorar nossa vida em sociedade. Ok, não é nada como a invenção da prensa, mas tem potencial pra ajudar.

O único problema desse contexto todo é que a Internet é um vasto espaço. Essa hiperconexão trouxe também a necessidade de arrumarmos um jeito de facilitar a vida das máquinas, que precisam processar o conteúdo disponibilizado por vários sistemas de modo a permitir cruzamentos interessantes e ligações automáticas entre conceitos.

Os modelos de coleta e distribuição de dados nem sempre prevêem integração e isso promove silos de dados isolados, desperdiçando potencial de uso e aproveitamento deste valioso recurso. É como seu eu deixasse uns tomates estragarem na geladeira enquanto um vizinho está fazendo macarrão sem molho.

A Web Semântica, junto à tecnologias da OpenWeb, é a proposta do Tim Berners Lee pra resolver esse problema. Batizada de The Next Web, a proposta é usar a Web como plataforma para cruzamento, interligação, interconexão, acervo, uso, reuso, mixagem e o que mais inventarem com dados que,  – aí sim – podem ser batizados de ABERTOS.

Então, não adianta nada publicar documentos em .pdf ou .xls, sem dizer para as máquinas que processam tudo algumas informações sobre estes dados: de onde vêm, a que se referem, quando foram coletados, que tipo de licença possuem, etc… Chamamos isso de metadados: os dados dos… dados. Também precisamos explicar melhor o sentido das coisas para as máquinas, que ainda são mais burras que nós. Pra isso, temos os vocabulários, base para as Ontologias.

Existem mais padrões pensados exatamente para isso: tcharam! O W3C tem um espaço só pra lidar com essas belezinhas. É o Data Activity, que reúne iniciativas que pretendem impulsionar o uso da Web para que seja usada como uma plataforma inteligente de integração de dados e não apenas como um sistema de distribuição e coleta de recursos. Nesse contexto, a conclusão é precisamos de mais publicadores de dados integrados prontos para a Web do futuro.

Após perceber a necessidade de impulsionar a publicação de dados na Web o W3C lança um novo grupo de trabalho, que pretende produzir guidelines para facilitar a publicação de dados para desenvolver o ecossistema de dados na Web: o Data on the Web Best Practices. O grupo já tem mais de 30 participantes de todo o mundo e a idéia é crescer ainda mais. Temos um repositório novinho pra rechear de vocabulários e guidelines no GitHub, além de uma wiki que vai ser recheada de recomendações do W3C, como padrões Web, em 2016.

Ah! Eu sou uma “chair” desse grupo de trabalho, junto com a Hadley Beeman, do Governo britânico e o Steven Adler, da IBM Data.

Este post é um convite pra todo mundo que não quer mais brincar de reinventar a roda e está afim de inventar novos jogos com ela. Saiba mais clicando aqui ou mande um email para w3cbrasil (at) nic.br – e vamos publicar dados abertos!