Pular para o conteúdo principal

Quando os robôs começarem a produzir as notícias

Como os algoritmos estão ajudando os repórteres a ampliar a cobertura, engajar o público e responder às últimas notícias

POR CELESTE LECOMPTE

Philana Patterson, editora assistente de negócios da Associated Press, vem cobrindo negócios desde meados da década de 1990. Antes de se juntar à equipe da agência de notícais, ela trabalhou como repórter de negócios para jornais regionais e para a Dow Jones Newswires e como produtora na Bloomberg. "Escrevi milhares de histórias sobre empresas e editei ainda mais", diz ela. "Estou muito familiarizada com os casos de sucesso".

Patterson gerencia mais de uma dúzia de funcionários na editoria de notícias de negócios e sua experiência a colocou em um comitê de estilo da AP, que define as diretrizes para as histórias de negócios. Então, em 2015, quando o AP precisava de alguém para treinar seu novo membro da redação sobre como escrever uma história de negócios, Patterson era uma escolha óbvia.


O estagiário era, no caso, um software chamado Wordsmith. No final do primeiro ano de trabalho, escreveria mais histórias do que Patterson tinha produzido em toda a carreira. O trabalho da editora assistente era de colocar o sistema em atividade.

A tarefa de Patterson é cada vez mais comum nas redações jornalísticas.
Profissionais da ProPublica, Forbes, The New York Times, Oregon Public Broadcasting, Yahoo e outros estão usando algoritmos para ajudá-los a contar histórias sobre negócios e esportes, além de educação, desigualdade, segurança pública e muito mais. 

Para a maioria das organizações, automatizar partes de relatórios e processos de publicação é uma forma de reduzir a carga de trabalho dos repórteres e aproveitar os novos recursos de dados. A automação está levantando novas questões sobre o que significa codificar o produção de notícias com uso de algoritmos, como personalizar histórias para atingir públicos específicos sem fazer erros éticos e como comunicar esses novos esforços ao público.

As empresas jornalísticas asseguram que a automação também está abrindo novas oportunidades para os jornalistas fazerem o que devem fazer melhor: contar histórias que importam. Com novas ferramentas para descobrir e entender enormes quantidades de informações, jornalistas e editores estão encontrando novas maneiras de identificar e relatar acontecimentos humanos importantes associados a grandes dados.

A experiência adquirida, os padrões da indústria e o estilo próprio da AP ajudam a Patterson e sua equipe a contar histórias empresariais. Mas como um computador pode conhecer o estilo adequado? Ele precisa de conjuntos de regras, conhecidos como algoritmos, para ajudá-lo. Um algoritmo é projetado para realizar uma tarefa específica.

O algoritmo de pesquisa do Google ordena sua página de resultados. O feed de notícias do Facebook determina quais postagens você vê. E um algoritmo de navegação, como o Waze, determina como você vai chegar a uma praia. Os algoritmos de Wordsmith, utilizados pela AP, escrevem histórias.

Para escrever uma história, a Wordsmith precisa de dados sobre a tarefa específica e princípios orientadores sobre o geral. 

Seu GPS precisa saber onde você está agora e para onde você está indo. Também precisa saber que "dar direções" significa mostrar a rota mais rápida do ponto A ao ponto B, que depende de uma variedade de outros dados, como se as ruas sejam de um jeito, quais são os limites de velocidade e se há tráfego ou construção.

Da mesma forma, para escrever uma história do mercado corporativo, a Wordsmith precisa de dados específicos sobre os ganhos trimestrais de uma empresa. Também precisa saber como contar a história de receitas e quais informações ela precisa para atingir esse objetivo.

Para treinar Wordsmith, Patterson teve que pensar nas possíveis histórias que os dados poderiam contar e quais métricas podem ser importantes. Uma empresa reportou lucro ou perda? Confirmou, bateu ou ficou abaixo das expectativas dos analistas? Será que fez melhor ou pior do que no último trimestre ou no ano anterior?

Decidir quais métricas e dados podem ser importantes foi uma tarefa de fiação. "Você tem que pensar em tantas variáveis ​​quanto possível, e mesmo assim você pode não pensar em todas as variáveis", diz ela.

Trabalhando com outros jornalistas na editoria de negócios, ela se instalou em um punhado de argumentos, com toda a variedade que os acompanha. Ela então trabalhou com desenvolvedores de software da Automated Insights, a empresa de Durham, Carolina do Norte, nos Estados Unidos, criadora do Wordsmith, que traduziu esses modelos de história em código que o computador poderia executar para criar uma história única para cada nova matéria sobre empresas.

Em 2015, a AP já produzia cerca de 3.500 histórias por trimestre usando o sistema automatizado, e esse número deverá crescer para mais de 4.500 no final do ano. A automação está decantando, em grande parte devido ao crescente volume de dados disponíveis para redações jornalísticas, incluindo dados sobre as áreas que eles cobrem e as audiências que eles atendem.





A CORRIDA PARA PUBLICAR DADOS COMERCIAIS RAPIDAMENTE REMONTA À PRIMEIRA LLOYD'S LIST EM 1734

A história do negócio de notícias é, de certa forma, um histórico de dados. A capacidade de coletar e publicar informações críticas de negócios mais rapidamente do que outras tem sido uma proposta de valor chave desde que a Lloyd's List foi publicada pela primeira vez em Londres em 1734.

Empresas como Bloomberg e Thomson-Reuters construíram impérios sobre sua capacidade de fornecer dados de mercado para leitores de negócios . Mas, mesmo fora do cenário da mídia comercial, os dados foram uma parte importante do porquê os clientes se voltaram para os meios de comunicação: os resultados das caixas, o clima, os resultados das eleições, os anúncios de nascimento e morte e os resultados das pesquisas são todos elementos clássicos de um jornal.

Assim como a mídia sofreu uma revolução digital, então os dados que informam muitos elementos das notícias. A informação de todos os tipos é cada vez mais acessível na forma de "dados estruturados" - informações organizadas de forma previsível, como uma planilha eletrônica, banco de dados ou formulário preenchido. Isso o torna adequado para análise e apresentação usando computadores.

O crescimento de dados estruturados está no cerne de aumentar os esforços de automação. Negócios e esportes têm sido áreas de cobertura intensivas em dados, por isso não é surpresa que a automação seja usada nessas áreas primeiro. A ágata do esporte e do negócio estava entre os primeiros itens para sair das páginas impressas e encontrar novas casas online, em parte porque esse tipo de informação é facilmente tratada pelos sistemas digitais. Mas hoje, um crescente volume de dados privados e públicos está disponível em formatos digitais, e novas ferramentas facilitam a retirada de dados de formatos não digitais.

Mas os dados não são iguais às informações. A criação de conteúdo algorítmico não consiste apenas em transformar uma planilha de números em uma série de frases descritivas. Trata-se de resumir esses dados para um propósito específico.

Os dados da Associated Press são fornecidos pela Zacks Investment Research. A empresa usa analistas humanos que analisam os dados da Comissão de Valores Mobiliários e Valores Mobiliários, os preços de ações e os comunicados de imprensa para criar um feed personalizado dos números solicitados pela AP.

Esses dados são enviados para Automated Insights e o Wordsmith reúne as histórias seguindo as regras que a editora Patterson e seus colegas ajudaram a definir. Traduzir até os dados mais simples significa converter as diretrizes soltas que um repórter humano pode seguir em regras concretas que um computador pode seguir.

Por exemplo, um repórter humano pode ter uma ideia geral de quando o desempenho de uma empresa foi muito diferente das expectativas dos analistas, com base no conhecimento dele. Mas para o algoritmo, o sistema da AP precisa especificar intervalos exatos para os quais o spread entre ganhos reais e expectativas é considerado grande ou pequeno.

Wordsmith usa essas métricas para decidir quais as palavras usadas para descrever os dados e como a história está estruturada, por exemplo, se o fato de que uma empresa frustrou as estimativas do analista deve ser mencionado no título. O algoritmo de montagem de histórias usa um conjunto pré-determinado de vocabulário e f
rases (conhecido como um corpus) que segue as rígidas regras de estilos de estilo do AP.

"É muito!", Diz Patterson. "Para criar um sistema para desencadear o tipo certo de história, nós, como repórteres, editores e programadores, precisamos descobrir essas coisas antes do tempo".
Você precisa saber, "o que é que você quer que seus dados lhe digam", diz Evan Kodra, cientista sênior de dados da Lux Research, uma empresa de pesquisa de mercado com sede em Boston. Quanto mais específicas as questões, melhores são os resultados. "Ainda é preciso muita criatividade para definir o problema".

Os editores dizem que essa é uma das razões pelas quais incorporam tecnologias de automação em seu fluxo de trabalho: permite que eles se concentrem no trabalho fundamental de ser um repórter. "Não é todo o nosso trabalho inteiro: entender o propósito de qualquer tipo de narrativa antes de fazê-lo?", Pergunta Scott Klein, um editor assistente de gerenciamento da ProPublica. "De certa forma, nosso trabalho é descobrir o propósito da história e descobrir uma maneira de dizer".

Na ProPublica, o jornalismo automatizado fazia parte inicialmente da "The Opportunity Gap", uma análise baseada em dados de quais estados estão (ou não) proporcionando a estudantes de ensino médio de baixa renda cursos de acesso a faculdades. E qual a taxa de sucesso.

Estudos demonstraram que o curso avançado de ensino médio pode melhorar os resultados da faculdade de um aluno. A análise foi baseada em um novo conjunto de dados do Departamento de Educação dos EUA. A ProPublica usou os dados para criar um aplicativo de notícias interativo para acompanhar a história. Os visitantes do site podem explorar os dados nos níveis federal, estadual, distrital e escolar.

Dois anos depois, a equipe estava se preparando para atualizar o aplicativo com os dados atuais, quando a Narrative Science , uma concorrente da Chicago Automated Insights, se aproximou deles. A plataforma da empresa, Quill, usa um método algorítmico similar para produzir histórias de conjuntos de dados.

A ProPublica passou meses analisando, interpretando, informando e corrigindo o conjunto de dados do Departamento de Educação. "Os dados foram tão bem estruturados e nós o entendemos tão bem", diz Klein, o que significa que era um bom ajuste para a automação. Eles decidiram usar ferramentas de automação para fornecer uma narrativa escrita para acompanhar cada uma das 52 mil escolas no banco de dados.

Cada um dos perfis necessários para fornecer um resumo dos dados para uma escola individual, mas também precisava conectar cada escola com a história mais ampla. Para fornecer o contexto, a ProPublica decidiu incluir tanto um parágrafo resumido que descreve a tese do trabalho de investigação mais amplo e uma comparação com outra escola para mostrar o contexto local. Para produzir as narrativas, os editores da ProPublica forneceram a Narrative Science com seu conjunto de dados completo, bem como alguns exemplos de revistas. Mas a parte mais importante foi selecionar as escolas certas para comparação.

Os editores queriam priorizar comparações que mostravam diferenças em relação às oportunidades, mas não era apropriado comparar uma escola na Califórnia com uma escola em Chicago porque as condições econômicas e de políticas podem variar amplamente em tais lacunas geográficas. Com base em seus relatórios, Klein e a editora de dados Jennifer LaFleur decidiram primeiro restringir a comparação com escolas dentro do mesmo distrito ou estado, antes de destacar dados que apresentassem semelhanças ou diferenças entre as escolas comparadas. "Mesmo que os dados pareçam os mesmos", diz Kris Hammond, cientista-chefe e co-fundador da Narrative Science, "há tantas condições ambientais diferentes que estão fora do escopo desses dados que as comparações não voariam e, em Fato, fazer falsas analogias.

Como qualquer repórter humano, os jornalistas de robôs precisam de editores. Mas o desafio de editar histórias geradas automaticamente não está em corrigir histórias individuais. É na reconversão do robô para evitar o mesmo erro.

Em maio de 2015, o New York Times escreveu um artigo sobre um novo estudo sobre como onde você cresce afeta suas oportunidades econômicas mais tarde na vida. O estudo usou registros fiscais para rastrear o destino de 5 milhões de crianças que se mudaram entre os condados dos EUA entre 1996 e 2012. O estudo concluiu: "A área em que uma criança cresce tem efeitos causais significativos em suas perspectivas de mobilidade ascendente". Para acompanhar O artigo, o time da Upshot produziu uma peça interativa que destaca dados para cada um dos 2.478 municípios incluídos no estudo.

Mas ao invés de apenas apresentar um banco de dados pesquisável ou um mapa zoomável, os editores de gráficos escreveram um artigo que se adapta ao usuário, com base na sua localização atual. Ao olhar para o endereço de IP do usuário, os parágrafos-chave destacam as estatísticas locais de renda e as comparam com as médias nacionais. O mapa de acompanhamento é focado automaticamente nesse município e seus vizinhos. Os usuários podem escolher outros locais, mas ao invés de ver uma história completamente separada, a mesma história recebe novos dados e um novo lede para a nova localização.

Quando " O melhor e o pior lugar para crescer " foi lançado, muitos usuários não notaram que o texto foi montado algorítmicamente. Eles acabaram de chegar à página e achavam que sua versão da história era a única versão da história. Essa experiência perfeita é parcialmente o ponto, mas vem com suas próprias demandas editorais.

"Porque as pessoas pensam que isso é editado por um editor humano, você tem que ter os mesmos padrões, precisão, qualidade e tom. Há um grande perigo em mexer as coisas ", diz Gregor Aisch, um editor de gráficos para The New York Times.


PARA OS MELHORES LUGARES PARA CRESCER, O NEW YORK TIMES USOU ALGORITMOS PARA MONTAR HISTÓRIAS QUE VARIAM DEPENDENDO DA LOCALIZAÇÃO DO USUÁRIO

A história usa blocos pré-atribuídos de texto e segue regras específicas sobre como montar parágrafos com base nos dados disponíveis. Em alguns casos, pode ser tão simples como substituir um novo número ou nome do condado. Para os condados de melhor e pior desempenho, a história recebeu frases adicionais que só apareceram nesses contextos. Além de editar os blocos pré-escritos de texto, os editores tiveram que verificar o fluxo entre frases em vários arranjos possíveis.

O desafio é ainda mais complicado para salas de redação usando sistemas como Quill ou Wordsmith, porque esses sistemas usam mais "variáveis ​​de palavras", e eles têm mais opções para descrever dados. Assim, os mesmos dados podem ser capazes de produzir uma dúzia de variações diferentes de uma história.

Por enquanto, o processo de edição dessas histórias é mais ou menos o mesmo que para escritores humanos: revisando rascunhos. Klein diz que a maioria dos rascunhos que ProPublica recebeu no início teve erros. Os dados que apareceram em partes erradas da história foram o erro mais comum. Uma vez que os editores marcam os rascunhos, os desenvolvedores fazem as alterações ao código para garantir que isso não aconteça novamente. Ao longo do tempo, a ProPublica sentiu-se confiante de que tinha um sistema que produzia histórias precisas e usava linguagem com a qual os editores estavam confortáveis.

A Associated Press também passou meses revisando rascunhos, refinando os algoritmos da história e verificando a qualidade dos dados fornecidos pela Zacks. No primeiro trimestre em que o sistema estava ao vivo, os editores revisaram rascunhos de cada história antes de serem colocados no fio, procurando por erros nos dados e na história. Agora, a maioria das histórias vai ao vivo sem fio, sem a revisão de um editor humano.

O AP diz que os únicos erros que ainda vê provêm de erros nos dados passados ​​para o sistema. Alguns são erros de digitação simples ou números transpostos, enquanto outros dependem de erros humanos mais complicados. A menos que os dados sejam recolhidos por um sensor digital, o processo quase sempre começa com os seres humanos fazendo a entrada de dados, o que muitas vezes é onde os problemas são introduzidos. Desde o início do projeto, diz Patterson, apenas dois erros publicados foram rastreados até o algoritmo.

Em julho, a Netflix lançou ganhos no segundo trimestre ao mesmo tempo em que suas ações sofreram uma divisão de 7 para 1. Mas os dados que Wordsmith recebeu não refletiram a divisão, então, o Wordsmith informou inicialmente que o preço de uma ação individual caiu 71 por cento e observou que a empresa perdeu as expectativas dos analistas quanto ao lucro por ação. Nenhum dos quais foi verdade.

Na verdade, os investidores que possuíam o estoque viram um aumento no valor de sua carteira; O preço da ação da Netflix mais do que duplicou desde o início do ano. Isto era, de fato, um erro humano: os dados do analista deveriam refletir o estoque dividido. Mas Wordsmith não possui um aviso automático que entra quando algo anômalo - como uma queda de 71% no preço da ação de uma empresa como Netflix - aparece. A lição, para histórias automatizadas e geradas por seres humanos:

A história foi atualizada com uma correção, seguindo os mesmos processos que para qualquer história gerada por seres humanos. Mas por causa da forma como as histórias AP são sindicadas, as versões não corrigidas da história persistem em linha . Patterson diz que é errado culpar a automação por esse tipo de erro. "Se os dados são ruins, você começa uma história ruim", diz ela.

Tom Kent, editor de padrões da AP, reconhece que os erros são um problema que o AP leva a sério - mas ele também aponta que as histórias escritas em humanos também não são livres de erros. "O trabalho muito estressante para um humano de reunir figuras e manter os conjuntos de dados separados e não misturar receita e renda e fazer os cálculos corretamente também foi uma receita para erros", ressalta. De acordo com Patterson, que supervisiona todas as correções (humanas ou não) para a mesa de negócios, a taxa de erro é menor do que antes da automação, embora ela não quis fornecer números exatos.

O imperativo de evitar erros levou o AP a manter suas histórias automatizadas simples, o que as torna bem, sem vida. Outros usuários do Wordsmith incluem descrições dos principais fatores, como a maioria dos jogadores que contribuem com pontos para esportes de fantasia ou ações e categorias de alto desempenho para resumos de portfólio financeiro, que influenciam a tendência geral em um conjunto de dados.

O AP optou por excluir esses fatos mais analíticos, muitas vezes incluídos em histórias humanas, da automação por causa de preocupações sobre adicionar demasiada complexidade muito rapidamente. "Há coisas que decidimos não fazer ainda, que foram apresentadas como possibilidades", reconhece Patterson. "Nós escolhemos não adicioná-los às histórias, porque estávamos realmente empenhados em garantir que a precisão das histórias estava intacta".

Em vez disso, a Associated Press possui editores humanos que agregam contexto a muitas de suas histórias automatizadas. Pelo menos 300 empresas ainda são observadas de perto pela equipe de funcionários da AP. Existem 80 empresas que sempre recebem relatórios e contexto adicionais pela equipe da Associated Press; Outros 220 são revistos pelos editores, que podem melhorar a história com seu próprio relatório ou contexto.

Esse sistema criou eficiências significativas para o AP, liberando 20% do tempo da equipe em toda a mesa do negócio, estima Lou Ferrara, o vice-presidente e editor-chefe que supervisionou o projeto. E isso não leva em conta o impacto da iniciativa nos clientes da AP.

NA AP, AS HISTÓRIAS AUTOMATIZADAS LIBERARAM 20% DO TEMPO DA  DE NEGÓCIOS

Um dos maiores impactos do projeto de ganhos automáticos da Associated Press foi a cobertura expandida de pequenas empresas que são principalmente de interesse para os mercados locais. Os clientes da AP são, em grande parte, lojas locais, e empresas de interesse para esses clientes caíram da cobertura AP durante os cortes dos anos 2000. Para as comunidades, esta foi uma perda potencialmente significativa. "Se há uma grande empresa, está empregando pessoas em sua família, seus vizinhos, pessoas com quem você vai à igreja", diz Patterson. "Há muitas pessoas interessadas na saúde econômica dessa empresa".

Em Battle Creek, Michigan, por exemplo, a Kellogg Company é um dos empregadores mais importantes da região, e suas impressões digitais estão em toda a cidade - de milhares de talões de pagamento mensais no banco para os nomes de uma escola para a alegria da WK Kellogg Foundation Com vista para o centro da cidade. Pat Van Horn é uma das pessoas locais que trabalhou na Kellogg até se aposentar em 2010. Ela e o marido Lance continuam a prestar atenção ao que está acontecendo na empresa. Eles têm amigos que trabalham lá e, como muitos locais, eles obtiveram ações da Kellogg em seu portfólio.

Então, cada trimestre, quando a empresa divulga suas declarações de ganhos, o olhar de Van Horns no Battle Creek Enquirer para ver como as coisas estão acontecendo. "Você sabe, qual foi o relatório de resultados deste trimestre, os dividendos serão X montante por ação", diz Lance. "Nós os
seguimos um pouco".

O Enquirer usa as histórias de ganhos da Associated Press como base para a cobertura da empresa; Repórteres locais adicionam contexto, explorando mais profundamente em questões que provavelmente afetarão Battle Creek. Isso liberta os repórteres e editores para fazer o trabalho que os computadores não podem fazer.

Para o AP, o licenciamento de conteúdo é o rei, constituindo a grande maioria da receita da empresa, e os clientes de jornal e on-line representaram 34% da receita de 2014. Continuar a entregar o conteúdo que os clientes desejam é fundamental para manter seus negócios. "Não é como se houvesse uma crescente receita nos mercados locais de qualquer maneira", diz Ferrara. Em vez disso, o AP vê os ganhos automatizados como uma forma de reter clientes, particularmente aqueles que foram atingidos por perdas de emprego em toda a indústria.

A AP está dobrando sobre essa estratégia; A empresa continuou a expandir seus esforços de automação, adicionando empresas públicas com uma capitalização de mercado acima de US $ 75 milhões, bem como empresas canadenses e européias selecionadas. Muitas dessas empresas nunca foram cobertas pelos escritores da AP. O mesmo é verdade para outras áreas de cobertura que a AP está procurando para automatizar, incluindo os jogos de futebol e basquete da faculdade Divisão II e Divisão III.

Ao descarregar o trabalho de relatórios básicos, o AP espera que seja mais fácil para os trabalhos locais se concentrar nas histórias que interessam aos membros da comunidade, como o Van Horns. "Nós não estamos aqui apenas para estar fazendo números", diz Lisa Gibbs, editora de desktops da AP. "Estamos realmente escrevendo essas histórias para os clientes que são mais propensos a ter comprado no Walmart do que possuir estoque individual no Walmart".

Gibbs foi contratado logo após a introdução das histórias de ganhos automatizadas. Ela diz que foi uma oportunidade para a equipe repensar como a empresa ia cobrir negócios. Com a automação, Gibbs diz que sua equipe conseguiu se concentrar em fazer os tipos de histórias de empresas de médio porte que tinham sido espremidas antes. Ela aponta o exemplo de uma peça do repórter comercial Matthew Perrone, que cobre a US Food and Drug Administration, que informou sobre a falta de supervisão regulamentar para o crescente número de clínicas de células-tronco. "Nós pudemos levar algum tempo, enviá-lo para viajar para algumas dessas clínicas e, finalmente, publicar a história", diz ela.

Alexis Lloyd, do The New York Times R & amp; D Lab, diz que o pensamento do público sobre a automação não mudou desde a década de 1950 Alexis Lloyd do New York Times R & D Lab diz que o pensamento do público sobre automação não mudou desde a década de 1950 Joe Pugliese / agosto

OAP não está sozinho no uso da automação para suportar seus esforços de relatórios. Um dos primeiros lugares para adotar a automação na redação foi o Los Angeles Times. O relatório de homicídio do jornal mantém um banco de dados com informações sobre cada homicídio relatado pelo escritório do jutista do Los Angeles County; Cada perfil de vítima inclui uma breve redação gerada automaticamente. Cabe aos repórteres decidir quais histórias merecem um relatório mais aprofundado.

O LA Times criou as lições desse projeto com a introdução em 2011 do Quakebot . Ken Schwencke, um editor digital no balcão de dados do LA Times na época, usou dados do Serviço de Notificação de Terremoto do USGS para gerar automaticamente relatórios curtos sobre terremotos acima do limite "notável" de uma magnitude 3.0. Os repórteres do LA Times analisam as histórias, as publicam e atualizam a história com informações adicionais à medida que elas se tornam disponíveis. A grande vantagem do Quakebot é a velocidade; Uma história pode ser postada online em menos de cinco minutos. Este tipo de papel assistivo é aquele que muitas organizações de notícias insistem é a base de seus esforços de automação.

O AP recentemente contratou seu primeiro "editor de automação de notícias", Justin Myers.

Ele se senta na equipe editorial e é representado pela News Media Guild, assim como seus colegas editoriais. Seu trabalho é ajudar a descobrir como racionalizar os processos editoriais e "dar tempo aos escritores, editores e produtores, que em muitos casos estão atrapalhando todos os processos que construímos ao longo dos anos, em vez de nos concentrar em fazer jornalismo ".

Myers passou seus primeiros meses no trabalho principalmente entrevistando repórteres, editores e produtores para descobrir o trabalho que ele pode ajudar a tirar seus pratos. A pergunta número um que ele está perguntando: "Como você gasta seu tempo?" Se é possível automatizar algumas das tarefas onerosas do funcionário, Myers está feliz em ajudar. "Vamos fazer com que um computador faça o que um computador é bom, e vamos ter um ser humano para o que um ser humano é bom", diz ele.

Alexis Lloyd, diretor criativo do The New York Times R & D Lab , concorda. O pensamento do público em geral sobre a automação não foi atualizado desde a década de 1950, diz ela. Normalmente, imaginamos um cenário de tudo ou nada: tudo com humanos ou com máquinas. Ela diz que está errado; Em todos os tipos de indústrias, a abordagem da automação mudou para se concentrar em tecnologias mais assistivas. "Nós pensamos que o futuro do jornalismo computacional e da automação será e deveria ser um colaborativo, onde você tem máquinas e pessoas trabalhando juntas de maneira muito conversacional", diz ela.

Várias organizações de notícias estão usando a automação para apoiar o trabalho de seus repórteres nos bastidores também. Lloyd mencionou Editor , uma nova ferramenta que se integra com o sistema de gerenciamento de conteúdo da empresa para ajudar os jornalistas a marcar conteúdo, fornecendo sugestões automatizadas. Estão em curso esforços semelhantes na BBC News Labs , com uma ferramenta chamada Juicer .

"O FUTURO DO JORNALISMO COMPUTACIONAL E DA AUTOMAÇÃO SERÁ E DEVE SER UM COLABORATIVO."

-ALEXIS LLOYD, DIRETOR CRIATIVO DO NEW YORK TIMES R & D LAB

Essas ferramentas suportam organizações de notícias em seu empurrão para desenvolver novos formatos de narração que destacam as relações entre eventos de notícias e ajudam a oferecer aos leitores um contexto mais rico. A maioria desses esforços exige grandes quantidades de metadados detalhados que podem ajudar a unir histórias que tenham em pessoas comuns, lugares ou idéias. Adicionar metadados é uma tarefa frustrante para a maioria dos repórteres, que normalmente estão mais preocupados em elaborar sua história do que dissecá-la. A automação é uma maneira de expandir o uso de metadados - sem colocar um encargo extra para repórteres e editores.


ARTIGO RELACIONADO
Jonathan Stray em ferramentas simples de relatórios de robôs

As ferramentas de trás das cenas também podem ajudar os repórteres de maneiras mais pró-ativas. Por exemplo, outra ferramenta do The New York Times R & D Lab rastreia automaticamente suas histórias no Reddit, procurando conversas favoritas e alerta os jornalistas quando há uma discussão ativa sobre o trabalho que eles possam estar interessados ​​em monitorar ou participar.

Esta é uma das áreas mais promissoras para a automação na sala de redação, diz Nick Diakopoulos, professor assistente da Faculdade de Jornalismo Philip Merrill da Universidade de Maryland, que estudou o uso de algoritmos na mídia. Ao rastrear redes sociais ou outros conjuntos de dados públicos, as ferramentas de automação podem ajudar a suportar o armazenamento de notícias em um ambiente digital. O uso de ferramentas de automação como essas pode aumentar a conscientização dos jornalistas sobre problemas, ajudá-los a prestar atenção a conjuntos de dados importantes, ou ouvir conversas e reagir mais rapidamente, diz ele.

PERSONUMAEUEUZUMATEUONUMANDREVENVOCÊE

Automation também pode se tornar uma ferramenta útil para se conectar com o público de forma mais direta. Em junho, jornalistas da Oregon Public Broadcasting (OPB) lançaram um aplicativo de notícias para acompanhar uma série sobre a preparação para terremotos no estado. O aplicativo, chamado Aftershock , fornece um relatório personalizado sobre os impactos prováveis ​​de um terremoto de magnitude 9,0 na localização de qualquer usuário dentro do estado, com base em uma combinação de conjuntos de dados.

O cenário não é apenas especulativo; A região é amplamente esperada enfrentar um terremoto maciço desse tipo, conhecido como o terremoto de Cascadia. "A OPB tem feito um monte de cobertura no terremoto de Cascadia e como as pessoas podem se preparar, mas muitas pessoas não se importam com um tópico até que ele os afete diretamente", diz Jason Bernert, da OPB. "Quando você os coloca no centro da história, eles se interessam".

OS RELATÓRIOS AUTOMATIZADOS DE PREPARAÇÃO DE TERREMOTOS LOCALIZADOS EM OREGON PUBLIC BROADCASTING DESPERTARAM OS OUVINTES PARA SUAS VULNERABILIDADES

Aftershock usa conjuntos de dados sobre impactos de terremotos que foram modelados pelo Departamento de Geologia e Indústrias Minerais de Oregon e zonas de impacto definidas pelo relatório do Oregon Resilience Plan. Os dados misturam e combinam classificações para coisas como agitação, liquefação do solo, risco de deslizamento de terra e tsunamis. No total, existem 384 combinações possíveis, e os usuários vêem uma versão da história relevante para a localização que selecionaram.

Tal como acontece com o "O melhor e o pior lugar para crescer" do The New York Times, o aplicativo de notícias combina dinamicamente os vários elementos da história - o que a equipe da OPB chama de "snuggets", um portmanteau de "nuggets de história", baseado no Dados para cada local.

Alguns dados se aplicam a regiões amplas do estado, mas outros conjuntos de dados têm impactos estimados para regiões tão pequenas quanto 500 metros. Aftershock aproveita essa granularidade, mostrando aos usuários os impactos esperados para endereços específicos. "Há uma grande diferença entre um terremoto de 9.0 em Oregon e" sua área é onde a agitação vai ser a pior ", diz Bernert. "Ele tem uma resposta emocional diferente para as pessoas começar conversas diferentes".

O apelo editorial de projetos como este é claro, mas a personalização tem o potencial de atrair o interesse do lado comercial também. Na sequência da publicação em meados de julho do artigo detalhado do New Yorker sobre o terremoto de Cascadia , diz Bernert, o tráfego de Aftershock aumentou. Por alguns dias depois, o site estava processando 300 vezes o número usual de pedidos.

Outros relatórios da OPB sobre o terremoto de Cascadia viram um aumento no tráfego, mas "o verdadeiro motorista social foi Aftershock", diz ele. No Facebook, os usuários estavam compartilhando Aftershock e dizendo: "Isso é o que vai acontecer comigo; É melhor eu sair e me preparar "e encorajar os outros a verificarem como eles também serão afetados.
robôEnsine seus computadores bem:

Evite o viés algorítmico

Embora nenhuma das implementações atuais tenha se concentrado nos esforços de monetização especificamente relacionados ao conteúdo personalizado, é o aspecto da automação que poderia ter o maior efeito sobre a receita potencial de notícias. UMAutilização já está sendo usada hoje para personalizar algumas homepages das organizações de notícias ou para fornecer recursos "recomendados para você". Ao aumentar o engajamento com os usuários, a automação que personaliza o conteúdo pode ter impactos positivos nas receitas de publicidade e assinaturas.

Esse tipo de personalização provoca ansiedade entre muitos profissionais de notícias, que se preocupam com que a personalização limitará a exposição dos leitores às editoras de histórias que possam considerar importantes em favor de coisas frívolas. Como Mark Zuckerberg disse ao descrever o valor do News Feed, "Um esquilo morrendo na sua casa pode ser mais relevante para seus interesses agora do que pessoas que morrem na África".O Joe Procopio da Automated Insights, certo, com o CEO da empresa Robbie Allen, diz que a personalização é uma área de crescimento

O Joe Procopio da Automated Insights, certo, com o CEO da empresa Robbie Allen, diz que a personalização é uma área de crescimentoRoderick Aichinger / Brand Eins

Por enquanto, a maioria dos esforços de personalização de artigos concentra-se em tipos de usuários, assim como o Aftershock usa a automação para combinar endereços específicos com cenários gerais. É mais como ter uma camisa com as medidas do colar direito e do comprimento da manga do que uma feita à mão, customizada. "Ainda não conseguimos isso para a pessoa", reconhece Joe Procopio, diretor de produto da Automated Insights.

Isso é verdade mesmo para os algoritmos mais sofisticados que são usados ​​por agências de crédito, varejistas e empresas de pessoal; Grandes quantidades de informações pessoais são crunched para usuários de pigeonhole como um "tipo" que pode ser usado para prever o risco de inadimplência do empréstimo, enviar cupons perfeitos para você ou caracterizar seu estilo de gerenciamento. Tome o exemplo da Crystal , uma ferramenta de inteligência artificial que ajuda você a escrever melhores e-mails para indivíduos específicos, com base em seus perfis online. O programa analisa as coisas que alguém escreveu on-line, como o perfil do LinkedIn e identifica-os como um dos 64 tipos. Cada tipo tem dicas de comunicação associadas sobre coisas como o vocabulário a evitar, quantos detalhes incluir e como o idioma deve ser formal.

A Automated Insights fornece esse tipo de personalização para seus clientes comerciais já - um site de vendas de carros usa o Wordsmith para mostrar aos usuários uma descrição ligeiramente diferente dos veículos com base em seu perfil, diz Procopio. Um comprador de carro pela primeira vez pode mostrar uma descrição que enfatiza o desempenho do combustível do carro, enquanto uma mãe no mercado de um veículo familiar pode ver descrições que enfatizam as classificações de segurança. Em ambos os casos, a informação nos perfis é a mesma, mas as características diferentes são priorizadas.

Diakopoulos diz que a falta de dados é uma barreira significativa para tal personalização de histórias. Para avançar para uma verdadeira personalização, as organizações de notícias precisariam coletar mais informações sobre seus usuários e desenvolver estratégias para abordar histórias para esses diferentes tipos de usuários. "As organizações de notícias não são muito boas até mesmo com modelos de usuários", apontou Diakopoulos. "Eles realmente não sabem quem está em seu site. Isso é muito diferente de ter um perfil de usuário robusto e uma capacidade de adaptar a página com base no perfil de cookies e assim por diante ".

Mesmo que os usuários concordassem em fornecer informações mais detalhadas, ao fazer login no Facebook ou no LinkedIn, os jornalistas ainda precisariam estar atentos aos esforços para direcionar esses usuários com conteúdo de maneiras específicas. A complexidade envolvida na automação de uma história com apenas uma variável-geografia - se tornaria exponencialmente mais difícil. Para salas de redação, que apresenta desafios significativos para edição, verificação de fato e escrita de múltiplas variações dos "snuggets" para serem usados ​​nas histórias. "Há preocupação", diz Procopio, "que alguém vai ler uma história e não obter todos os fatos porque está tendencioso em relação a essa pessoa. Não acho que essa preocupação seja justificada ".

À medida que a tecnologia melhora, o valor potencial da personalização de uma perspectiva de receita certamente se tornará mais importante. Frank Pasquale, professor da Faculdade de Direito Francis King Carey da Universidade de Maryland e autor de um livro recente sobre o poder generalizado dos algoritmos, " The Black Box Society ", argumenta que, se as histórias podem eventualmente ser personalizadas para usuários com base em fatores como Sua renda, onde eles vivem, ou qualquer uma das microcategorias (por exemplo, "amante do gato", "Walmart shopper" ou "sofredor de DST") que os corretores de dados coletam de nossas vidas on-line, as salas de notícias quase certamente enfrentarão pressão para fazer assim. "Isso vai ser visto, eventualmente, como maximizar as receitas", diz Pasquale.

Ele sugere uma pergunta para as salas de redação considerarem que eles aplicam a personalização: "Até que ponto é essa" personalização do "esquilo morto" e até que ponto esta personalização que atrai as pessoas de forma criativa em histórias sobre outras partes do mundo?

Para se concentrar no último, uma opção é confiar menos em dados pessoais amplos que provocam medos sobre quais algoritmos assumem que um usuário é e, em vez disso, se concentram no que é relevante sobre o relacionamento de um usuário com uma história específica. Por exemplo, a equipe Upshot do New York Times publicou recentemente algumas histórias que usam interações na história para adaptar uma história aos conhecimentos ou visualizações existentes de um usuário sobre o assunto.

Em um caso, os usuários foram convidados a desenhar uma linha em um gráficoEles pensaram que representavam taxas de matrícula da faculdade em grupos econômicos. Com base na linha desenhada, os usuários mostraram uma das 16 versões diferentes da história, cada uma das quais explicou os dados reais ao compará-los com os próprios pressupostos do usuário sobre o problema.

Foi uma peça simples, mas muito bem sucedida, de jornalismo explicativo, porque focalizou o artigo escrito sobre informações mais relevantes para o leitor, sem alterar as partes relatadas das histórias.
Projetos como estes também possuem a vantagem de transparência interna sobre quais características estão sendo usadas para automatizar a criação da história. Os usuários fornecem ativamente a informação ao sistema para obter a informação que desejam, e os dados de entrada estão claramente vinculados à própria história.

PEQUENAS ORGANIZAÇÕES DE NOTÍCIAS PODERIAM, DE FATO, TIRAR O MÁXIMO PROVEITO DO JORNALISMO AUTOMATIZADO. ELES ESTÃO BEM POSICIONADOS PARA DESENHAR DADOS LOCAIS PARA ESCREVER HISTÓRIAS

A transparência é um dos problemas mais marcantes que os sistemas de automação enfrentam, particularmente quando se cruzam com a personalização. Kent, o editor de padrões da AP, pensa que preocupações sobre a transparência algorítmica são exageradas quando se trata de gerar conteúdo automaticamente.

"O jornalismo humano não é tão transparente", diz ele. "As organizações de notícias não acompanham seus artigos com uma descrição completa do que estava na mente do jornalista que poderia ter afetado seu processo de pensamento, se ele estava com uma resfriada, acabou de ser desligado por um representante de serviço ao cliente da empresa que ele era Escrevendo sobre, e assim por diante ".

Como as regras que regem a forma como as histórias automatizadas são reunidas estão disponíveis para escrutínio, o jornalismo automatizado pode ser mais transparente do que as histórias escritas por humanos, argumenta ele. Mas para a maioria dos projetos, é difícil saber o valor que os leitores podem encontrar nas divulgações, mesmo que sejam apresentadas. Mike Dewar, um cientista de dados no The New York Times R & D Lab, escreveu sobre a futilidade da documentação de publicação se nenhum dos publicitários pretendidos puderes lê-lo. Em vez de publicar apenas dados de código aberto ou documentação sobre algoritmos, ele argumenta, a comunidade precisa adotar normas e procedimentos comuns.

Esse tipo de padronização poderia beneficiar os usuários não técnicos, que se familiarizarão com a forma como esses projetos funcionam e o que esperar. A padronização também pode ajudar as pequenas redacções a experimentar a automação. Na OPB, o Aftershock foi um projeto de grande sucesso, mas exigiu algum levantamento pesado da pequena equipe de mídia pública. Bernert e seu colega Anthony Schick construíram o aplicativo durante uma compilação de três dias patrocinada pela escola de jornalismo da Universidade da Oregon, com a assistência pró-bono de uma empresa local de design interativo, estudantes e acadêmicos.

"Há muito valor para esse tipo de trabalho", diz Bernert. "Mas como podemos torná-lo sustentável para uma pequena sala de redação de mídia pública?" Ter um conjunto compartilhado maior das tecnologias e metodologias ajudaria.

Pequenas organizações de notícias poderiam, na verdade, ter o máximo para ganhar com o uso da automação. Enquanto Wordsmith e Quill estão focados em expandir em mercados de dólares grandes, como informações financeiras e seguros, eles demonstraram sua tecnologia em uma variedade de dados locais, como relatórios de qualidade da água das praias públicas e atividades públicas de estações de bicicletas.

As organizações de notícias locais podem estar bem posicionadas para aproveitar esse tipo de dados estruturados usando automação, seja expandindo sua cobertura ou criando novos produtos. Os fornecedores comerciais obtiveram uma série de fluxos de receita mais importantes das organizações de notícias, encontrando melhores maneiras de fornecer anúncios classificados, listagens de emprego, vendas de casas e outras informações, muitas das quais disponíveis sob a forma de dados estruturados.

Afinal, a automação é sobre colocar narrativas em torno de dados, e as organizações de notícias têm as habilidades e a experiência necessárias para fazer exatamente isso.


http://niemanreports.org/articles/automation-in-the-newsroom/

Comentários

Postagens mais visitadas deste blog

Como ser um jornalista na internet

Para ser um jornalista online, você precisa conhecer quatro "coisas". Um designer. Um programador de sistemas. Uma empresa capaz de valorizar profissionais capacitados e de dar bons empregos para vocês três. E o mais importante: saber muito sobre comunicação e marketing e um pouco sobre design e tecnologia. Esta deve - ou deveria - ser a resposta padrão para pergunta freqüente feita por jornalistas, novos e antigos, interessados em atuar no novo mercado criado pela internet. Muitos deles imaginam que as portas digitais serão abertas por algum curso sobre as inúmeras tecnologias desenvolvidas para o desenho e gerenciamento de sites. "Tenho muita vontade de atuar em jornalismo na internet, e estou fazendo um curso de Dreamweaver", anunciam os abnegados candidatos a emprego minimamente digno nesta praia de muitas ondas nem sempre boas para surfar. Outros, constrangidos, contam em segredo: eu queria muito trabalhar na internet, mas não sei nada de informática. Menos imp

Quem matou o jornalista

Zélia Leal Adghirni A mídia não reflete a opinião pública. A sociedade pensa uma coisa e a mídia fala outra. E o pior: muitas vezes seleciona e reproduz só aquilo que coincide com os interesses políticos e econômicos do momento. O alerta foi dado pelo professor e pesquisador americano da Universidade do Colorado, Andrew Calabrese, durante o 29º Congresso Brasileiro de Ciências da Comunicação (Intercom), que reuniu, na semana passada, mais de três mil professores, alunos e pesquisadores em comunicação na Universidade de Brasília em torno do tema Estado e Comunicação. Calabrese fez graves criticas à mídia americana que, segundo ele, exagerou no patriotismo em detrimento da informação após os atentados de 11 de setembro de 2001. De acordo com o professor, o discurso da Casa Branca e da grande mídia passou a ser quase unificado. A mídia quis fazer uma demonstração de patriotismo e solidariedade e acabou abraçando a decisão do governo de invadir o Iraque sem o respaldo da opinião da opinião

Jornalistas serão substituídos por robôs?

Os jornalistas podem - e vão - ser substituídos por robôs?