
A capacidade e facilidade em reunir e armazenar informações em um banco de dados, assim como sua utilização, cresce a cada dia e na mesma proporção que as novas tecnologias desenvolvidas e propagadas para facilitar o trabalho do consumidor. Com a popularização da rede mundial de computadores, quase todo e qualquer conteúdo produzido passa a ser colocado em um espaço considerado até então infinito, reflexo e atualização também de produtos comunicacionais palpáveis, como revistas, jornais e principalmente livros.
Todos, quase sem exceção, estão migrando aos discos rígidos de computadores pessoais ou permanecendo em nuvens. Logo, a atividade em reunir a maior quantidade de informações e disponibilizar de forma organizada, simples e objetiva, começa a se tornar uma tarefa obrigatória ao mundo da comunicação, mas concomitantemente árdua e repleta de ruídos.
Este processo, uma espécie de “garimpagem informacional”, tem nome. Knowledge Discovery in Databases (Descoberta de Conhecimento em Bases de Dados) refere-se ao método minucioso de descobrir e conhecer em dados fases ou tarefas de um sistema. Segundo Frawley, Piatetsky-Shapiro e Matheus (1992, p. 2), trata-se de um campo específico “não-trivial de identificação de novos padrões válidos, potencialmente útil e compreensível em conjunto de dados”.
Conhecida como um processo de mineração de dados, a etapa do Data Mining (KOCH, 1991) baseia-se em uma análise de conjuntos de dados que tem como princípio a descoberta de padrões que possam representar, a posteriori, informações úteis. As ferramentas tecnológicas de Data Mining identificam as possibilidades de correlações existentes nas fontes de dados. Segundo Han e Miller (2001, p. 9), o conceito busca uma “descrição compacta de dados” e, por se tratar de um processo interativo, as pessoas envolvidas durante sua construção deve obrigatoriamente possuir um canal de comunicação que viabilize troca de informações para que, em seu produto final, o consumidor – no caso jornalístico, o leitor – utilize o conteúdo extraído do Data Mining para auxiliá-lo no processo de obter conhecimento.
Nos últimos anos, o conceito de Data Mining começa a ser explorado com maior intensidade no Jornalismo. Desde o início do século XXI e o desenvolvimento vertiginoso da tecnologia e o acesso à rede mundial de computadores, o processo de mineração de dados precisa de uma “inteligência artificial para lidar com as modificações semânticas das palavras, por exemplo” (LIMA JR, p. 9, 2004), com a simples intenção em tornar um sistema eficiente de relacionamento de informação e, principalmente, conhecimento.

Um reflexo destas características é a criação do projeto de Jornalismo Colaborativo do jornal norte-americano Washington Post. Em junho de 2007, a publicação lançou o LondounExtra.com, espaço destinado às contribuições de leitores, mas com uma participação de profissionais do próprio WP. O projeto, de caráter hiperlocal, é dedicado aos mais de 280 mil habitantes do condado de Londoun, próximo à capital dos Estados Unidos, Washington, e conta com uma integração e transparência de escolas, igreja e comércio local para a distribuição de dados locais na web, promovendo e agregando em um único ambiente virtual um banco de dados rico para a população e autoridades públicas.
Este post faz parte de excertos produzidos durante o Mestrado sobre Jornalismo e Comunicação Digital.
[parte] da bibliografia
AMITAY E., HAR’EL N., SIVAN R., SOFFER A., Web-a-where: Geotagging Web Content. In Proceedings of the 27th SIGIR, pages 273–280, 2004.
FAYYAD, Usama M.; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From Data Mining to Knowledge Discovery: An overview. In: ADVANCES in knowledge discovery and data mining. FAYYAD et al. G. Cambridge-Mass:AAAI/MIT Press. 1996. p. 1-27. Disponível em <https://www.aaai.org/ojs/index.php/aimagazine/article/viewFile/1011/929>. Acessado em 12 out. 2009.
LIMA JR, Walter Teixeira. Jornalismo Inteligente (JI) na era do Data Mining. In CD Anais do II. Encontro Nacional de Pesquisadores dem Jornalismo, Salvador, SBPjor, 2004.
LINDELL, Yehuda. Privacy Preserving Data Mining. Department of Computer Science
Weizmann Institute of Science, Israel, 2006. Disponível em <http://www.pinkas.net/PAPERS/id3-final.pdf>. Acessado em 29 nov. 2009.
MILLER, Harvey; HAN, Jiawei. Geographic Data Mining and Knowledge Discovery: an overview. Taylor and Francis, London, 2001. Universidade de Utah. Disponível em <http://www.geog.utah.edu/~hmiller/papers/Handbook_GIS.pdf>. Acessado em 12 out. 2009.
NAONE, Erica. Mining Social Networks for Clues, MIT. Disponível em <http://www.technologyreview.com/computing/23101/?nlid=2235&a=f>. Acessado em 29 nov. 2009.
AMITAY E., HAR’EL N., SIVAN R., SOFFER A., Web-a-where: Geotagging Web
Content. In Proceedings of the 27th SIGIR, pages 273–280, 2004.
CASTELLS, Manuel. A sociedade em rede. Vol. 1. 4ªed. São Paulo: Paz e Terra, 2000.
DWYER, C. Digital Relationships in the ‘MySpace’ Generation: Results From a Qualitative Study. Proceedings of the 40th Hawaii International Conference on System Sciences (HICSS), Hawaii, 2007
FAYYAD, Usama M.; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From Data
Mining to Knowledge Discovery: An overview. In: ADVANCES in knowledge discovery
and data mining. FAYYAD et al. G. Cambridge-Mass:AAAI/MIT Press. 1996. p. 1-27. Disponível em <https://www.aaai.org/ojs/index.php/aimagazine/article/viewFile/1011/929>. Acessado em 12 out. 2009.
JENSEN, D.; NEVILLE, J. Data mining in networks. Papers of the Symposium on Dynamic Social Network Modeling and Analysis. National Academy of Sciences. November 7-9, 2002. Washington, DC: National Academy Press.
JENCKS, C. What is Post-Modernism?, Academy Editions, 1986.
KOCH, Tom. Journalism for the 21st Century. Online information, electronic databases and the news. New York: Praeger, 1991.
LIMA JR, Walter Teixeira. Jornalismo Inteligente (JI) na era do Data Mining. In CD Anais do II. Encontro Nacional de Pesquisadores dem Jornalismo, Salvador, SBPjor, 2004.
LINDELL, Yehuda. Privacy Preserving Data Mining. Department of Computer Science
Weizmann Institute of Science, Israel, 2006. Disponível em <http://www.pinkas.net/PAPERS/id3-final.pdf>. Acessado em 29 nov. 2009.
MILLER, Harvey; HAN, Jiawei. Geographic Data Mining and Knowledge Discovery: an overview. Taylor and Francis, London, 2001. Universidade de Utah. Disponível em <http://www.geog.utah.edu/~hmiller/papers/Handbook_GIS.pdf>. Acessado em 12 out. 2009.
NAONE, Erica. Mining Social Networks for Clues, MIT. Disponível em <http://www.technologyreview.com/computing/23101/?nlid=2235&a=f>. Acessado em 29 nov. 2009.
O´REILLY, Tim. What is Web 2.0, 2006. Disponível em <http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html>.
ROSADOS, Helen Beatriz Frota. O jornal e seu Banco de Dados: uma simbiose obrigatória. Ind: DoIS (Documents in Information Sciente), Issue 1, Volume 26, Ano 1997.
SALAVERRÍA, Ramon. Redacción periodística en internet. Pamplona; EUNSA, 2005.
SBARAI, Rafael. A definição da participação do cidadão nos modelos colaborativos jornalísticos na web, São Paulo, 2009.
SEN, Arun; JACOB, Varghese S. Industrial-strength data warehousing. Communications of the ACM, v. 41 n. 9: 28-31. Sept, 1998.
SMITH, Anthony. Goodbye Gutenberg: The newspaper revolution of the 1980s. New York:
Oxford University Press, 1980.
TUROW, Joseph. Americans and Online Privacy: The system is broken. University of Pennsylvania, 2003. Disponível em <http://www.asc.upenn.edu/usr/jturow/internet-privacy-report/36-page-turow-version-9.pdf>. Acesso em 23 nov. 2009.
WAUTERS, Robin. The Death Of “Web 2.0”. TechCrunch, fev. 2009. Disponível em <http://www.techcrunch.com/2009/02/14/the-death-of-web-20/>. Acesso em 08 out. 2009.