Check the Fact - Samsung Solve For Tomorrow
Coaching-Phase

Check the Fact

Wir bieten die erste KI-getriebene Plattform zur Überprüfung der Glaubwürdigkeit von Texten und News. Damit wollen wir helfen, der massenhaften Verbreitung von Fake News Einhalt zu gebieten.
10 Kommentare

https://www.check-the-fact.com/

Die Herausforderung

Nie haben sich falsche Informationen schneller verbreitet als jetzt. Sei es in WhatsApp-Gruppen, Twitter oder unzureichend recherchierten Artikeln. Bei sensiblen Themen wie Covid-19 sind Fehlinformationen nicht nur ein Ärgernis, sondern werden schnell zu einer echten Gefahr für einzelne Menschen, wie auch die Gesellschaft als solche.

Die Zielgruppe

Wir richten unsere Anwendung an alle Bürger, die damit ein Tool an die Hand bekommen, Informationen auf ihre Vertrauenswürdigkeit zu überprüfen. Außerdem ist die Plattform interessant für Journalisten und Politiker, die oft nicht die Zeit haben selbst Informationen detailliert zu überprüfen.

Das Team

Wir können unser Projekt umsetzen, weil bei uns Leute aus allen wichtigen Bereichen motiviert an einem Strang ziehen. Wir haben Entwickler mit verschiedenen Schwerpunkten (KI, NLP, Frontend etc.) sowie betriebswirtschaftliche Expertise.

Die Lösung

Nutzer können eine URL oder einen Text in das Textfenster auf unserer Web-App einfügen. Unser Algorithmus bewertet den Inhalt und gibt in Echtzeit ein Ergebnis zur Glaubwürdigkeit des Texts zurück. Auch die wichtigsten Quellen für die Bewertung werden dem Nutzer zur tiefergehenden Recherche zur Verfügung gestellt. Die Auswertung setzt sich dabei aus mehreren Komponenten zusammen: Einem Sprachmodell zur Analyse des Rohtexts, einem Abgleich mit unserer Datenbank, sowie einem Community-Voting System, das es Nutzern erlaubt, an der Auswertung eines Texts mitzuwirken. Wir haben ein Machine-Learning Modell (NLP) implementiert, das laufend trainiert und so seine Analyse verbessert.

Fragen an die Community

Noch nicht ganz klar ist die Ausgestaltung der Community-Funktion, da wir hier natürlich subjektive Einflussnahme verhindern müssen. Außerdem sind wir offen für Ideen und Anregungen jeder Art zu weiteren Features etc.
45+
Lorenz KammerSam GrafChristina MarienmaierStefan SchusterJoshua GrafKyra BoydFrank DannhauerJesper WallischLuis EckhardMatthias LöschenkohlSaid LachhabFelix UngerMaximilian ReuterGiulia ColandreaJohannes SeibtDaniela FritschieJanis ZigurisMarina ThieleChristoph ReuterLaurenz CzarnetzkiMichail JoutchenkoLaura KwiatonJulian HüppauffXaver HaneltSamuel MauchMichael BoecherJan Hendrik HeihoffChristoph LaurerTobias SchneiderMatthias KalbEdward GolkeDaniel Straulescumaika paetzoldKatja MüllerJonas MüllerClaudio BurtschenkoSONIA ETERNOJonas RigoMax BücherlMarion Reuter-StraulescuOrlando GalashanRobin Anna VitalTamara DeuschleTobias BusseLeonhard Czarnetzki

0 thoughts on “Check the Fact

  • Holger Hoffmann-Riem

    Hallo Max, ich denke das Erkennen von Fake News wird immer wichtiger. Und nicht jeder hat dafür ein so grosses Rechercheteam wie die New York Times. Was mich bei eurem Ansatz interessieren würde:

    – Ich nehme an euer NLP-Algorithmus wird anhand von manuell klassifizierten Fake News trainiert. Wie stellt ihr sicher, dass die Klassifikation, mit der das Lernen erfolgt, korrekt ist? Das blöde bei Fake News ist ja, dass die Autoren abstreiten dass es Fake ist, so dass es nicht ganz einfach ist hier eine eindeutige Klassifikation zu machen. Auch beim berühmtesten Urheber von Fake News gibt es nicht nur schwarz und weiss, sondern manchmal auch Grautöne…

    – habt ihr schon eine Ahnung, wie ihr damit Einnahmen generieren könnt? Wer würde euch zahlen?

    Herzliche Grüsse
    Holger

    5+
    • Maximilian Reuter

      Hi Holger,
      das ist natürlich eine der wichtigsten und auch schwierigsten Fragen, die wir lösen müssen. Wie bewerten wir richtig, differenziert, faktenbasiert und neutral, sodass wir nicht selbst zur Quelle ungenauer Angaben werden.
      Den Anfang haben wir mit händisch gelabelten Datensätzen gemacht. Zusätzlich gibt es Datensätze im Internet, die wir nutzen um unsere eigene Datenbasis zu erweitern und den den NLP-Algorithmus zu verbessern.
      Außerdem haben Nutzer die Möglichkeit, selbst Falschmeldungen einzureichen und damit unsere Datenbank zu füttern. Die eingereichten Texte müssen natürlich auch überprüft werden, was in Zukunft der Algorithmus selbst übernehmen soll. Das Modell steht in seinen Grundzügen, und kann einige Sachverhalte auch schon zuverlässig erkennen. Um den Algorithmus allerdings so robust zu bekommen, dass er auch komplizierte Konstrukte erkennen kann, müssen wir noch eine Menge Arbeit reinstecken.

      Zum Geschäftsmodell: Die Hauptfunktion – ein Faktencheck für den Alltag – soll kostenlos und für jeden zugänglich sein.
      Allerdings planen wir eine Premium-Version mit weiterführenden Recherche-Tools anbieten wollen. Wir planen dafür beispielsweise darzustellen, wo eine Nachricht das erste Mal aufgetaucht ist und wie sie sich verbreitet. Auch tägliche Updates und Trendanalysen könnte man generieren.
      Ein solches Tool könnte für Redaktionen interessant sein. Die haben heutzutage wenig Zeit selbst ausführlich zu recherchieren und stehen unter hohem Druck, Texte zu produzieren.

      Beste Grüße
      Max

      11+
  • Katja Müller

    Das ist ja ein super spannendes Projekt – darauf hab ich schon lange gewartet, dass man mal die Möglichkeit hat, über so eine Plattform Fakten zu überprüfen. Haltet mich bitte auf dem Laufenden!

    4+
    • maika paetzold

      In jedem Fall überfällig und ein wirklich wichtiges Thema mit Zukunft. Wir versuchen bei allen Entscheidungen verantwortungsbewusst mit der Thematik umzugehen und einen deutlichen Mehrwert für verschiedenste Nutzergruppen zu schaffen.

      2+
  • Tobias Busse

    Hallo Maximilian,
    das klingt wirklich nach einem vielversprechenden Projekt! Ich halte die Verbreitung von Fake News in Kombination mit fehlender Medienkompetenz fuer eine der grossen Herausforderung unserer Generation. Daher waere ich gespannt zu wissen wie ihr mit einigen Dingen, die mir spontan als moegliche Hindernisse oder Probleme einfallen, umgeht bzw. sie beurteilt:

    Als Faktencheck ist Transparenz ungemein wichtig. Fuer Benutzer*innen sollte klar sein, auf welcher Grundlage die Klassifizierung stattfindet, gerade wenn eine “kuenstliche Intelligenz” die Instanz darstellt, die entscheidet ob etwas “wahr” oder “unwahr” ist. Je genauer jedoch Aussenstehende wissen, wie die KI trainiert wird, welche Datenbank zugrunde liegt und welche Schwaechen sie moeglicherweise hat, desto einfacher kann es sein, diese zu manipulieren. Moeglicherweise auch an der Feedback-Schnittstelle.
    Seht ihr das auch als Problem und wenn ja, wie geht ihr damit um?

    Und mich wuerde noch interessieren, ob ihr nur den Inhalt an sich bewertet oder auch die Quelle, Metadaten, etc. (Ist der/die Autor*in oder das Medium bereits durch Verbreitung von Falschmeldungen aufgefallen?, Stammen Begleitbilder ggf aus anderem Kontext?, Kursieren zu dem Thema z.Zt. besonders viele Falschmeldungen?, …)

    Wie geht ihr mit Projektfoerderung und Interessenkonflikte um?

    Beste Gruesse und weiter viel Erfolg,
    Tobias

    5+
    • Holger Hoffmann-Riem

      Sehr guter Punkt. Mir hat mal ein Informatiker gesagt es sei einfach, KI mit KI ausser Gefecht zu setzen indem man ein KI-System schafft, welches das angewendete System überlistet. @Maximilian: habt ihr euch damit mal auseinandergesetzt? Ich habe keine Ahnung ob dieses Argument stichhaltig ist.

      1+
      • Leonhard Czarnetzki

        Hallo Holger,

        das ist prinzipiell möglich. Um eine KI zu trainieren, die das tut, benötigt man allerdings eine gewisse Datengrundlage. Diese könnte man schaffen indem man unsere KI “nachtrainiert” oder indem man die Bewertungen unserer Seite “sammelt”.
        Hier könnten gewisse Beschränkungen (zB eine bestimmte Zahl an Zugriffen pro Tag, gründliche Prüfung von neu eingepflegten Artikel durch die Community, etc.) dabei helfen, dies schwieriger zu gestalten.

        Für das “nachbilden” unserer KI würde der gesamte Datensatz, alle Hyperparameter und die Architektur benötigt werden. Diese behalten wir uns aber vor.

        Das Thema Sicherheit ist eines der Kernthemen mit denen wir uns in der Entwicklung in Zukunft auseinandersetzen müssen. Letztendlich hängt unsere Unabhängigkeit und damit auch unsere Existenzgrundlage davon ab.

        Liebe Grüße
        Leon

        4+
    • Leonhard Czarnetzki

      Hallo Tobi,

      die Bewertung eines Artikels setzt sich aus verschiedenen Faktoren zusammen. Wir prüfen Artikel mit unserer Datenbank (durch die Community gepflegt) gegen, lassen den Artikel von unserer KI prüfen und führen eine Volltextsuche aus, um zu sehen auf welchen Seiten dieser Artikel erschienen ist. Auch die Glaubwürdigkeit der publizierenden Seite bzw. der Seiten auf denen der Artikel erscheint geht in unsere Bewertung mit ein.

      Du hast natürlich völlig Recht. Transparenz ist sehr wichtig. Aus diesem Grund ist unser Code auch (fast komplett) auf GitHub verfügbar. Bestimmte Teile davon, so zum Beispiel die internen Parameter unserer KI und die zu Grunde liegende Datenbank, sind das aber nicht. Einerseits ist das eine Möglichkeit um sich gegen bestimmte Angriffe zu schützen, auf der anderen Seite auch Vorraussetzung, um eine Premium-Version anbieten zu können.

      Angriffe und Manipulationen unserer KI bzw. unserer Datenbasis sind aber ein großes Thema und in der Zukunft sicher ein Punkt, der besonders viel Arbeit in Anspruch nehmen wird.
      An der Feedback-Schnittstelle zB ist eine Manipulation unserer Datenbasis und damit auch der KI prinzipiell möglich. Um dieses Problem zu lösen, wären verschiedene Ansätze denkbar (Moderation aus der Community, eine KI, die eingepflegte Einträge überwacht, etc.).

      Wie schon oben erwähnt bewerten wir auch Metadaten. In einer Premium-Version wollen wir diese dann auch weitergeben, zum Beispiel um Redaktionen die Recherche zu erleichtern.

      Bei potentiellen Förderern müssen wir natürlich sehr darauf achten, unsere Unabhängigkeit und damit auch unsere Glaubwürdigkeit, nicht zu gefährden. Dadurch können wir nur mit Förderern zusammen arbeiten, die kein Interesse an der Verbreitung von Informationen haben.

      Ich hoffe ich konnte deine Fragen so weit beantworten.
      Liebe Grüße
      Leon

      4+

Leave a Reply

Skip to content