5 outubro 2009

APIs abertas de dados do governo

por Alexandre Fugita

Em diversas conversas que já tive com o Pedro Markun do Jornal de Debates um assunto recorrente foram os dados públicos abertos. Nos EUA o presidente Obama determinou um prazo para que todas as esferas do governo abram seus dados publicamente através de APIs para que qualquer um possa usar essas informações como desejar em mashups, webapps, etc. Aqui no Brasil aconteceu no último fim de semana o 1o. Transparência HackDay com o objetivo de mostrar e criar aplicativos que tornem alguns dados públicos abertos.

O mais interessante foi ver que os desenvolvedores e entusiastas que participaram do evento conseguiram extrair alguns dados de bases públicas disponíveis mas não tão acessíveis assim. Mais ou menos como se criassem APIs para dados que não as tem. Genial, não?

Políticos API

Duas dessas iniciativas fizeram isso extraindo dados sobre políticos brasileiros. O projeto do Parlamento Aberto (Helder Ribeiro), listou todos os deputados brasileiros e extraiu uma lista de tudo que eles estão fazendo. Já o projeto Dados Públicos (Pedro Valente) “parseou” o site Transparência Brasil usando o YQL (Yahoo! Query Language) e extraiu informações sobre políticos brasileiros. Por enquanto tais dados limitam-se a uma foto do político e seu CPF. Mas muitas informações poderão ficar disponíveis por uma API.

Multimídia API

O projeto ABrCrawl (Fabricio Zuardi) é um robô que vasculha o site da Agência Brasil e disponibiliza as fotos do sistema para serem usadas por quem quiser. Como a Agência Brasil licencia seu conteúdo em Creative Commons, é possível usar as fotos até comercialmente desde que a fonte seja citada. Usando os dados do ABrCrawl eu imaginei um Agência Brasil Vision, ao estivo Flickr Vision ou Twitter Vision!

Já o projeto MetaVid (Pedro Markun) tem a ideia de se basear no MetaVid americano que pega os streamings do C-Span (uma espécie de TV Senado) e os disponibiliza na web. A ideia aqui é fazer exatamente o mesmo com a TV Senado e canais públicos que mostram sessões plenárias.

USP oauth API

A Universidade de São Paulo (USP) possui seu sistema de login que autentica seus alunos e funcionários quando entram em seu site. Mas e se você quiser autenticar um aluno para um webapp externo de qualquer natureza? Pois é, uma das criações foi um sistema que, dado o login e senha de um usuário, ele verifica se o sistema USP o autentica como válido. Claro, como todo espírito #hackday, não existe autorização prévia da USP para isso. A possibilidade mostrada é criar votações autenticadas mas em webapps externos. Quem sabe isso aumente a transparência da universidade?

Sustentabilidade API

Dois projetos envolveram preocupações com o meio-ambiente. Um deles, o Tr3e (Thiago Carrapatoso), trata os dados do INPE sobre desmatamento e apresenta de forma mais amigável para nós.

O outro projeto foi sobre lixo eletrônico (Maira Begalli). A Maira, idealizadora da ideia, nos contou que não há dados sobre lixo eletrônico (não é spam, e sim baterias, carcaças, essas coisas) disponíveis facilmente. Conseguiu depois de muito esforço uma planilha PDF com informações sobre o assunto. Então essa é uma crítica ao Ibama, Cetesb ou outro órgão que trate do assunto. Cadê as bases de dados? No final ela apresentou um vídeo sobre o assunto.

Educação API

O projeto Mapa da Eja (Bianca Santana) tem o objetivo de tornar disponível informações sobre escolas que promovem a Educação de Jovens Adultos. Esses dados são pouco divulgados e adultos que não terminaram os estudos não sabem onde procurar esse tipo de informação. Uma mapa já localiza as escolas que tem o EJA e futuramente a ideia é plotar também os adultos que precisam desta educação como forma de sensibilizar a sociedade para o problema.

Clone do Planalto

Claro, o blog clone do Planalto não é um projeto do Transparência Hack Day. Mas não poderia deixar de mencionar aqui tal acontecimento já que os criadores do clone são também os organizadores do #thackday. O Markun e a Daniela B. Silva criaram o clone do Planalto no espírito de transparência. Um blog que simplesmente clona todos os posts do blog oficial com a diferença de permitir comentários. Ótimo, não?

Governo API

Pois é, depois de toda essa discussão, cadê as APIs abertas do governo? Seria realmente interessante que todas as esferas da administração pública tornassem informações abertas através de APIs. Restaria aos cidadãos criarem ferramentas que utilizassem esses dados para os mais variados projetos.

Com a Copa em 2014 e as Olimpíadas em 2016 no Brasil muita gente já começou a se mobilizar para que informações financeiras sobre esses dois projetos fique disponíveis e abertas à população e essa é uma grande oportunidade do Governo brasileiro adotar APIs abertas para dados públicos. Será?

Leitura recomendada:

O que aconteceu no 1º Transparência HackDay, via Tiago Dória Weblog
Fotos no Flickr do #thackday

30 setembro 2009

Naspers quer dominar a web no Brasil

por Alexandre Fugita

Claro, estou exagerando. Mas quem acompanhou as notícias de ontem sabe que a sul africana Naspers comprou 91% do grupo Buscapé por US$ 342 milhões. É uma quantia significativa por um negócio web brasileiro e mostra o quanto a Naspers/ MIH está interessada no mercado tupiniquim. A MIH é o braço digital e tem participações em outras empresas do círculo web brasuca como a WebCo e na Compera nTime, além da Abril Digital. Neste texto uma breve descrição dos interesses da Naspers no Brasil.

Buscapé

O Buscapé é o maior player do mercado nacional de comparação de preços. O site tem uma história daquelas das startups de garagem. Tudo começou com um servidor na casa de um dos fundadores e tornou-se um gigante do e-commerce brasileiro. A compra da participação pelo grupo sul africano é seu pontapé no mercado de comércio eletrônico brasileiro.

WebCo

A WebCo – o site deles está fora do ar – cuida de aplicativos sociais e web como o Blogblogs e o Brasigo. Com bastante dinheiro para investir a WebCo tinha um grande e impressionante escritório na Chácara Santo Antônio (bairro de SP) mas agora está no prédio da Editora Abril.

O Manoel Lemos, fundador do Blogblogs e hoje CTO da Abril Digital, criou o Blogblogs para aprender Ruby on Rails e conta que o primeiro robô que soltou para procurar blogs achou 40 mil deles enquanto ele tinha ido ao cinema.

O Brasigo existe faz cerca de um ano e é uma rede social de perguntas e respostas e concorre com pesos pesados como o Yahoo! Respostas, tradicional e bastante forte no Brasil.

Compera nTime

A Compera nTime produz aplicativos sociais e móveis como por exemplo o Diário Celular, um mix de Twitter com SMS que “roda” dentro do Orkut. Tem parcerias com operadoras de celular brasileiras para alguns aplicativos usados em suas redes que vão de quiz (perguntas e respostas) até softwares relacionados à música e ringtones. A Naspers detém 49% da Compera há cerca de um ano.

Abril Digital

A Naspers possui exatos 30% da Editora Abril. Provavelmente não detém mais pois a lei proíbe participação maior do que isso de capital estrangeiro em grupos de mídia. O provável interesse da Naspers na Abril é a área digital e não a impressa. Tanto isso é verdade que a Abril Digital é dona da WebCo e seu fundador é também CTO da Abril Digital como já havia citado.

Um aplicativo que surgiu dessa união é o PinFotos (já escrevi sobre ele aqui), uma espécie de Flickr, ou seja, novamente concorrendo com um produto Yahoo!.

Um possível resultado dessa parceria é a Naspers conseguir fazer o negócio digital da Abril começar a dar dinheiro para substituir o meio impresso como geradora de receitas.

Oportunidades

É sempre interessante ver grupos estrangeiros interessados no Brasil principalmente no mercado de internet. Aqui o mercado de startups web é crescente – eu sei, o Buscapé não é uma startup, vamos dizer assim – mas ainda está longe do que acontece nos EUA, por exemplo. A visibilidade que a Naspers deve dar ao Brasil com mais essa aquisição pode ajudar a desenvolver o mercado nacional de startups web. Que o Brasil tenha seu próprio vale do silício!

24 setembro 2009

A questão da nuvem e o Gmail

por Alexandre Fugita

Está virando rotina o Gmail sair do ar e o mundo todo questionar se o serviço é confiável para manter todos os seus e-mails e várias informações importantes em servidores na internet. Principalmente empresas que são o foco do Google Apps e que ao verem notícias deste tipo ficam com um pé atrás em confiar na nuvem.

O interessante a notar é que essas preocupações são na maioria das vezes exageradas. Sim, o Gmail já chegou a ficar mais de 2 horas fora do ar no início deste mês – na verdade foi só a interface web – mas quantas horas o sistema corporativo de e-mails da sua empresa ficou indisponível no último ano? Certamente muito mais do que isso.

O que acontece é que a percepção dos problemas no Gmail são amplificadas pelo fato de o tempo todo em todos os lugares do mundo alguém estar usando a interface web do serviço. Somos 150 milhões, e se o Gmail cai um monte de gente percebe em segundos.

A maioria dos sistemas corporativos não tem tantos olhos atentos assim. Cem, duzentas pessoas. Mil, talvez 5 mil. E se o e-mail dessas pessoas fica inoperante não vira manchete nos portais e blogs. Ou seja, sistemas corporativos de e-mail podem ser bem mais instáveis que um Gmail, por exemplo, mas os departamentos de TI continuam morrendo de medo dessa história de nuvem.

Além disso a maioria dos ambientes corporativos usa algum tipo de cliente de e-mail, em geral o Outlook da Microsoft. E pelo que notei em praticamente todas as quedas recentes do Gmail o problema sempre foi na interface web e não que usa pop, imap ou exchange no seu cliente de e-mail favorito.

E esse problema do Gmail me fez lembrar uma conversa que tive com amigos no final de semana. Um deles resolveu que vai começar a usar mais a nuvem para armazenar informações. O motivo foi a recente necessidade de mandar o notebook para a assistência técnica e a preocupação com anos de dados acumulados em seu HD aos olhos de estranhos. Já o outro ainda se diz cético em relação a manter seus dados em um servidor pela internets.

Claro, cada um faz do jeito que achar melhor. Eu já percebi que desde passei a usar o Gmail em Julho de 2004 – nossa, tanto tempo assim? – nunca mais precisei me preocupar com backups de mensagens ou e-mails perdidos. Enquanto isso milhares de HDs de computadores pessoais e notebooks pifaram e pessoas ficaram a ver navios. Pra que usar a nuvem se eu posso me divertir perdendo informações (fotos, emails, música) e fazendo backups?

Leitura recomendada:

O quanto você quer viver na nuvem?, no Peixe Fresco

17 setembro 2009

Sinais de que Google = Skynet

por Alexandre Fugita

A mais recente compra do Google é o reCaptcha. O que parece ser uma simples compra de um serviço interessante indica uma tendência que a gigante de Montain View tem de querer fazer as máquinas entenderem o mundo. E é bem diferente da forma como o Wolfram Alpha vem fazendo. Seria tudo isso um protótipo da Skynet? Acompanhe os sinais desse enigma.

ReCaptcha: leitura

O ReCaptcha é um serviço que se utiliza do captcha – aquelas letras tortas ou embaçadas que só um humano consegue entender – para ajudar no reconhecimento de palavras escaneadas de livros antigos e irreconhecíveis por softwares de OCR (reconhecimento ótico de caracteres).

É bastante simples e toda vez que é acionado mostra duas palavras “tortas”. Uma delas o ReCaptcha sabe qual é e a outra o serviço quer reconhecer. Se você acertar a palavra que eles sabem qual é, possivelmente a palavra não identificada também está correta. Joga-se isso algumas vezes para seres humanos e respostas idênticas indicam mais uma palavra reconhecida.

É o bom e velho crowdsourcing. Ou seja, com ajuda de humanos o ReCaptcha permite às máquinas identificarem palavras borradas de livros velhos.

Google Voice Search: fonemas

A busca por voz que existe no Android e no iPhone, nada mais é do que, além de uma coisa legal para mostrar para os amigos, uma forma de capturar fonemas dos mais variados sotaques, entonações, emoções. Cada busca que alguém faz neste aplicativo móvel ajuda de alguma forma aos computadores do Google a melhorar o reconhecimento da voz humana.

Um sinal de que esse reconhecimento de voz está muito bom foi o fato do Google, no ano passado, ter transcrito discursos dos candidatos à presidência dos EUA no Youtube. Ou seja, computadores entendendo todos os sotaques e trejeitos da nossa fala.

Google Translate: poliglota

O tradutor do Google utiliza de um algoritmo matemático poderoso que analisa as palavras em conjunto e tenta mostrar a melhor tradução possível. Claro que comete erros banais mas não deixa de ser interessante que cada vez mais novas línguas são adicionadas. Surgiu até um serviço que tenta achar o equilíbrio em uma tradução do Google, do inglês para o japonês e vice-versa. O sistema usa o Google Translator para traduzir uma frase digitada pelo usuário de uma língua para a outra e vice-versa até achar o equilíbrio.

Mas o que isso tem a ver com a Skynet? Bom, a gigante de Montain View está construindo uma máquina que fala qualquer língua e já implementou no novíssimo Wave permitindo conversas instantâneas entre pessoas que falam idiomas diferentes. Imagina isso junto com o reconhecimento de voz…

Primeiro de Abril?

Como de costume o Google fez as suas brincadeiras de primeiro de Abril. E uma delas foi o CADIE, uma máquina que tomou consciência de sua existência e novídeo que divulga isso dá um toque de Exterminador do Futuro (Skynet), junto com 2001: Uma Odisséia no Espaço (HAL) e resolve assumir a direção da empresa, no caso o Google… Claro que é uma piada mas não seria algum projeto dos 20% que quase escapou do controle? :-)

Marissa Mayer

A super executiva do Google Marissa Mayer em uma entrevista com o fundador do Digg foi perguntada se o Google é a Skynet (sim, link para o vídeo). A resposta foi não, óbvio, as máquinas não deixaram, mas o que ela disse em seguida é interessante. Marissa diz que o Google acredita em fazer os computadores ficarem mais espertos, no sentido de entender o mundo ao nosso redor. Isso dá um basta na questão… por enquanto!

12 setembro 2009

Web 101 na Teia

por Alexandre Fugita

Em junho fui à Teia MG para participar de um dos Encontros na Teia, projeto interessante desenvolvido pelo pessoal do Peabirus e que entrevista ou faz um bate-papo com hubs da web. Já passaram por lá pessoas como o Gil Giardelli, da Permission, Edney Souza, do Interney Blogs ou ainda o Marcelo Tas, do CQC.

O formato da minha participação foi uma apresentação sobre conceitos básicos de web. Essa parte acho importante para todos que trabalham ou pretendem trabalhar neste mercado. E é por isso que estou republicando os vídeos aqui, três meses após a transmissão, pois é como se fosse uma recapitulação de vários posts deste blog. Falo de colaboração, crowdsourcing, cauda longa, economia da atenção, sabedoria das multidões, etc.

Em seguida respondi a perguntas enviadas pelos internautas que, ou acompanharam ao vivo ou haviam enviado questionamentos para votação antes. Se tiver um tempinho e não viu isso antes quando publiquei no Startupi, dê uma olhada. O tempo total deve ser cerca de oitenta minutos, a parte dos conceitos web fica na primeira metade. Os vídeos estão após a quebra de página ou na página do blog do Encontros na Teia. Aliás, no post deles tem uma historinha curiosa que aconteceu comigo e que envolveu café, uma Ferrari e Twitter e quem conta é a entrevistadora Juliana Lima!
(Leia o restante aqui…)

APIs abertas de dados do governo

Políticos API

Multimídia API

USP oauth API

Sustentabilidade API

Educação API

Clone do Planalto

Governo API

Leitura recomendada:

Naspers quer dominar a web no Brasil

Buscapé

WebCo

Compera nTime

Abril Digital

Oportunidades

A questão da nuvem e o Gmail

Sinais de que Google = Skynet

ReCaptcha: leitura

Google Voice Search: fonemas

Google Translate: poliglota

Primeiro de Abril?

Marissa Mayer

Web 101 na Teia

nuvem de assuntos