Forskere: AI-algoritme Betters mennesker i at finde falske nyheder

Del denne historie!
image_pdfimage_print
Technocrat-data forskere bjæger op på det forkerte træ. Bemærk, at de aldrig siger, at deres black box-algoritmer kan finde sandhed, hvilket logisk set bør gå foran isolering af usandsynligheder. Alligevel hyldes deres påståede gennembrud som 'et nyt våben i kampen mod forkert information.' ⁃ TN Editor

Et algoritmebaseret system, der identificerer fortællende sproglige signaler i falske nyhedshistorier, kunne give nyhedsaggregatorer og sociale mediesider som Google Nyheder et nyt våben i kampen mod forkert information, ifølge ny forskning.

Forskerne, der udviklede systemet, demonstrerede, at det kan sammenlignes med og sommetider bedre end mennesker til korrekt at identificere falske nyhedshistorier.

I en nylig undersøgelse fandt systemet med succes falske op til 76 procent af tiden sammenlignet med en menneskelig succesrate på 70 procent. Derudover kunne deres sproglige analysemetode bruges til at identificere falske nyhedsartikler, der er for nye til at blive debunked ved at henvise til deres fakta med andre historier.

Rada Mihalcea, en computer videnskabs- og ingeniørprofessor ved University of Michigan, der står bag projektet, siger, at en automatiseret løsning kan være et vigtigt værktøj for websteder, der kæmper for at tackle et angreb på falske nyhedshistorier, som folk ofte skaber for at generere klik eller til at manipulere den offentlige mening.

Det er svært at fange falske historier, før de får virkelige konsekvenser, da websteder med sammenlægning og sociale medier i dag er meget afhængige af menneskelige redaktører, der ofte ikke kan følge med tilstrømningen af ​​nyheder. Derudover afhænger aktuelle debunkingsteknikker ofte af ekstern verifikation af fakta, hvilket kan være vanskeligt med de nyeste historier. Ofte, når en historie er bevist som en falsk, er skaden allerede blevet gjort.

Sproglig analyse tager en anden tilgang og analyserer kvantificerbare egenskaber som grammatisk struktur, ordvalg, tegnsætning og kompleksitet. Det fungerer hurtigere end mennesker, og det kan bruges med en række forskellige nyhedstyper.

”Du kan forestille dig et vilkårligt antal applikationer til dette på forsiden eller bagenden af ​​et websted med nyheder eller sociale medier,” siger Mihalcea. ”Det kunne give brugerne et skøn over pålideligheden af ​​individuelle historier eller et helt nyhedssted. Eller det kan være en første forsvarslinje på bagsiden af ​​et nyhedswebsted, der markerer mistænkelige historier for yderligere gennemgang. En succesrate på 76 procent efterlader en ret stor fejlmargin, men den kan stadig give værdifuld indsigt, når den bruges sammen med mennesker. ”

Sproglige algoritmer, der analyserer skriftlig tale, er temmelig almindelige i dag, siger Mihalcea. Udfordringen med at opbygge en falsk nyhedsdetektor ligger ikke i at opbygge algoritmen i sig selv, men i at finde de rigtige data, som denne algoritme skal trænes i.

Falske nyheder vises og forsvinder hurtigt, hvilket gør det vanskeligt at indsamle. Det findes også i mange genrer, hvilket yderligere komplicerer indsamlingsprocessen. Satiriske nyheder er for eksempel nemt at indsamle, men dets anvendelse af ironi og absurditet gør det mindre nyttigt at træne en algoritme til at opdage falske nyheder, der er beregnet til at vildlede.

I sidste ende skabte Mihalceas team sine egne data, hvor man samlet et online team, der omvendt konstruerede bekræftede ægte nyheder i forfalskninger. Sådan oprettes de fleste falske nyheder af enkeltpersoner, der hurtigt skriver dem til gengæld for en monetær belønning, siger Mihalcea.

Forskere rekrutterede deltagere ved hjælp af Amazon Mechanical Turk og betalte dem for at forvandle korte, faktiske nyhedshistorier til lignende, men falske nyhedsartikler, der efterligner artiklenes journalistiske stil. Ved afslutningen af ​​processen havde forskerteamet et datasæt med ægte og falske nyhedshistorier 500.

De fodrede derefter disse mærkede par historier til en algoritme, der udførte en sproglig analyse, og lærte sig selv at skelne mellem ægte og falske nyheder. Til sidst vendte teamet algoritmerne til et datasæt med ægte og falske nyheder, der blev trukket direkte fra nettet og nettet 76 procent succesraten.

Detaljerne om det nye system og datasættet, som teamet brugte til at bygge det, er frit tilgængelige, og Mihalcea siger, at nyhedswebsteder eller andre enheder kunne bruge dem til at opbygge deres egne falske nyhedsdetekteringssystemer. Hun siger, at inkorporering af metadata som linkene og kommentarerne, der er forbundet med en given online nyhed, yderligere kan skærpe fremtidige systemer.

Forskerne vil detaljerede oplysninger om systemet i et papir, de vil præsentere på 27th International Conference on Computational Linguistics i Santa Fe, New Mexico.

Læs hele historien her ...

Deltag i vores mailingliste!


Tilmeld
Underretning af
gæst
0 Kommentarer
Inline feedbacks
Se alle kommentarer