14.11.2016

Tamedia

«Leser dürfen sich nicht als Sklaven der Personalisierung fühlen»

Für die 12-App hat Marcel Blattner einen Algorithmus entwickelt, der den Erfolg von Artikeln bei den Lesern vorhersagt. Im Interview sagt der Datenspezialist, wie wichtig Autor oder Rubrik für seinen RoboEditor sind und inwiefern solche Maschinen künftig Journalisten ersetzen. Zudem spricht er die Gefahren der Personalisierung an.
Tamedia: «Leser dürfen sich nicht als Sklaven der Personalisierung fühlen»
Arbeitet bei Tamedia Digital als Data Scientist: Marcel Blattner. (Bild: zVg.)
von Michèle Widmer

Herr Blattner, für die 12-App haben Sie einen Algorithmus programmiert, der bei der Selektion von Artikeln hilft. Wann wird der sogenannte RoboEditor erstmals einen Tagesleiter oder Blattmacher ersetzen?
Es geht nicht darum, jemanden zu ersetzen. Der RoboEditor soll als Unterstützung verstanden werden. Bei einer Flut von Artikeln dient er als intelligenter Filter, der die besten Kandidaten auswählt. Aber für die Selektion, die dann wirklich publiziert wird, braucht es den Menschen.

Welche Fähigkeiten fehlen dem RoboEditor diesbezüglich?
Algorithmen lernen aufgrund von existierenden Daten aus der Vergangenheit und projizieren diese für die Zukunft. Kommt es zu einem Bruch, tritt also beispielsweise eine Naturkatastrophe ein oder es kommt zu einem Anschlag, sieht der Algorithmus dies nicht.

Seit einem Jahr sammelt die Maschine Daten über die Leser und ihr Verhalten. Was genau weiss Tamedia über die 12-App-Nutzer?
Wir wissen, wie viele Leute einen Artikel anschauen und wie viele ihn teilen. Über die Feedback-Frage können wir herausfinden, wie viele Leser die Berichte bewerten und ob sie diesen als lesenswert empfinden oder nicht.

Der RoboEditor kann den Erfolg eines Artikels auf diese Weise auf bis zu 90 Prozent vorhersehen. Wie haben Sie «erfolgreich» für die Maschine definiert?
Die 90 Prozent sind ein Idealwert. Massgebend sind die Reichweite und die Bewertung durch die Leser. Das Ganze funktioniert als Trade-off. Im Idealfall wird ein Artikel von vielen Menschen gelesen und erhält gleichzeitig viele positive Bewertungen. Erfolgreich ist er aber zum Beispiel auch, wenn ihn nur wenige, aber dafür alle als lesenswert bewerten. Dann trifft der Beitrag eine spezifische Community.

Der verantwortliche Redaktor bei der 12-App lässt den Algorithmus täglich einige Dutzend ausgewählte Artikel des Tamedia-Verlags analysieren. Was genau muss er eingeben?
Zurzeit muss er für jeden Artikel den Titel, Lead, Text, Rubrik, Autor und die Quelle erfassen. Wir arbeiten aber daran, dass alle Artikel der Tamedia-Publikationen tagesaktuell in den RoboEditor eingespiesen werden. Der Redaktor muss dann nur noch den Knopf drücken, und die Maschine spuckt die besten Kandidaten aus. Darauf aufbauend kann dann der Journalist entscheiden, welche Selektion er vornimmt. Denkbar wäre hier eine Art Ampelsystem. Wenn der Artikel bei gewissen Metriken einen Wert unterschreitet, erhält der Redaktor die Mitteilung diesen nicht zu verwenden.

unnamedneu

Die Eingebemaske des RoboEditors mit der vorhergesagten Reichweite (reach), den erwarteten positiven Bewertungen (upvotes) und den potenziellen Interaktionen (engagement). (Bild: zVg, Klick für Grossansicht)

Welches Attribut hat den stärksten Einfluss. Erhalten zum Beispiel Artikel von Tagi-Journalist Constantin Seibt immer das Gütesiegel der Leser?
Der Autor hat weniger Einfluss als man denkt. Tausche ich bei der Eingabemaske den Autorennamen aus, verändert sich wenig. Das spricht für die Qualität der Inhalte. Massgebender ist die Rubrik, weil sie in gewisse Weise das Thema vorgibt. Nur latent eine Rolle spielt die Quelle, also ob der Beitrag von «20 Minuten» oder «Annabelle» stammt.

Dies, weil der Nutzer beim Klick auf den Artikel nicht weiss, von welchem Medium ihm das Stück serviert wird.
So ist es. Um die potenzielle Reichweite zu messen, bezieht sich der RoboEditor auf die Attribute Titel, Lead, Position und Rubrik – also jene, die der Nutzer auf den ersten Blick sieht. Um vorherzusagen, wie viele Leser den Artikel positiv bewerten oder diesen teilen, nimmt sich die Maschine den Artikeltext vor.

Wie geht er dabei vor?
Das Programm nimmt den Lauftext und extrahiert alle Bindewörter sowie die ganze Zeichensetzung und durchsucht ihn dann auf prominente Schlüsselwörter. Massgebend sind hier auch Gefüge aus zwei, drei oder vier Worten, die hintereinander folgen. Wenn zum Beispiel das Wort Wahlen vorkommt und ein Name eines bekannten Politikers daneben steht, hat das Einfluss auf die mögliche Bewertung.

Geben Sie dem RoboEditor diese Wörter vor?
Nein, diese Schlüsselwörter bringt er sich selber bei. Zum Beispiel bewertet er ein Wort als wichtig, wenn es nicht in jedem durchsuchten Artikel vorkommt, es also exklusiv in diesem Beitrag vorhanden ist. Dann erachtet die Maschine diesen Artikel als informativ. Diese Informationen bezüglich der Qualitätsbeurteilung werden dann mit der prognostizierten Reichweite korreliert.

Ein guter Algorithmus verbessert sich stetig selber. Wie macht Ihre Maschine das?
Seit dem Start der 12-App hat der Algorithmus rund 4000 Artikel analysiert. Zu allen haben wir die oben genannten Informationen, aufgelistet in einer Tabelle. Jede Woche fliessen neue Daten ein und die Maschine wird neu trainiert. Die App gewinnt immer mehr an Popularität, was die mögliche Reichweite steigern lässt. Diesen Trend erkennt der Algorithmus und trägt ihm Rechnung.

Wie überprüfen Sie vorab, ob seine Projektion stimmt?
Wir geben dem Algorithmus 70 Prozent von unseren Daten und lassen ihn lernen. Am Ende geben wir ihm alle Daten und überprüfen seine Berechnungen mit der Realität. Man muss sich vorstellen, dass da eine Unmenge an Stellschrauben am Werk sind. Deshalb kann der Mensch nicht nachvollziehen, wie genau sich die Maschine ständig verbessert. In gewissen Bereichen, in denen nicht wie bei der 12-App ein Mensch die letztendliche Auswahl übernimmt, ist dies ein grosses Problem. Denn Algorithmen kennen keine Ethik.

Die Feedback-Funktion soll auch in der neuen Newsnet-App, der Mobil-Anwendung für Tagi, BaZ oder Bund, die zurzeit entwickelt wird, integriert werden. Heisst das, Sie arbeiten mit ihrem Team an einer personalisierten Applikation für Tamedia?
Klar denkt auch Tamedia darüber nach. Das Projekt einer personalisierten App würde allerdings nicht nur unser Team betreffen, sondern da sind die Journalisten im Lead. Wir sind nur die Partner der Redaktionen.

Inwiefern könnten Sie auf bestehender Technologie aufbauen?
Der RoboEditor könnte für eine personalisierte Anwendung nicht eins zu eins übernommen werden. Die Informationen aus der Wörter-Extraktion zum Beispiel könnte man theoretisch gut mit den Daten der Nutzer korrelieren. Wir wissen ja, welche Themen oder welcher Rubriken-Mix einzelne Leserinnen und Leser besonders interessieren. Aber welche Funktion eine neue App am Schluss haben wird, bestimmen nicht wir.

Künftig könnte also jeder Nutzer auf den Apps von NZZ, Tagi oder 20 Minuten eine andere Frontseite zu Gesicht bekommen. Wo bleibt da die journalistische Einordnung, wenn jeder nur noch das zu sehen kriegt, was er will?
In der Tat müssen wir bei der Personalisierung in allen Lebensbereichen, nicht nur bei den Medien, aufpassen. Das allerwichtigste ist, den Benutzer sehr transparent darauf hinzuweisen, dass er für ihn ausgewählte Inhalte präsentiert bekommt. In diesem Sinne dürfen sich die Leser nicht als Sklaven der Personalisierung fühlen. 

Das heisst die Medien müssten trotzdem eine gewisse Diversität sicherstellen?
Bei den Empfehlungen braucht es einen Aha-Effekt, man muss auch zum Entdecken einladen. Genau wie das die 12-App heute ohne Personalisierung schon vorlebt. À la: Das ist zwar nicht mein Kerninteresse, aber ich finde es trotzdem spannend. Denn jemand, der viele Wirtschaft-Beiträge liest oder gern Texte aus dem Rubrik Sport konsumiert, kennt sich gut bei diesen Themen aus. Die Frage ist, wie sinnvoll hier eine Personalisierung.

Maschinen sollen also in Zukunft noch stärker die Selektionsaufgabe der Journalisten übernehmen. Werden Roboter bald auch fähig sein, ganze Artikel zu schreiben?
Technologie wird im Journalismus noch stärker unterstützend wirken. Klar strukturierte Texte wie zum Beispiel ein Wetterbericht oder Sportresultate kann vielleicht eines Tages ein Roboter übernehmen. Aber dass eine Maschine eine Analyse über eine hereingebrochene Wirtschaftskrise schreibt ist utopisch. Betrachtet man die technologische Entwicklung der letzten zehn Jahre, dann wird das auch in den kommenden 15 bis 20 Jahren nicht Realität werden.


Zur Person

Marcel Blattner ist seit Januar 2015 als Data Scientist bei Tamedia Digital tätig. Er verantwortlich die Entwicklung und Implementierung von neuester Methoden der Datenanalyse und prädikativer Modelle, um aus Daten neue und gewinnbringende Zusammenhänge zu extrahieren.



Newsletter wird abonniert...

Newsletter abonnieren

Wollen Sie Artikel wie diesen in Ihrer Mailbox? Erhalten Sie frühmorgens die relevantesten Branchennews in kompakter Form.

Kommentar wird gesendet...

Kommentare

  • Dieter Widmer, 15.11.2016 08:17 Uhr
    Mein Gott, und ich habe geglaubt, die Zeitungen würden Art und Länge eines Berichts aufgrund der Bedeutung und Wichtigkeit eines Themas festlegen. Verhalten sich Zeitungen jetzt bald wie ein herkömmliches Warenhäuser? Und trotzdem wollen die Medien den Stimmberechtigten künftig Vorwürfe machen, sie hätten sich nicht informiert und an der Urne fatale Entscheide getroffen. Wo sollen die Stimmberechtigten dann Informationen, auch trockene, aber wichtige holen
  • Beat Bucher, 15.11.2016 08:55 Uhr
    Achtung vor dem Tunnelblick! Wer nur personalisierte News zu Lesen bekommt, verliert den Blick auf die Wirklichkeit!

Diese Artikel könnten Sie auch interessieren:

Anzeige
Zum Seitenanfang