PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Kann eine Software Menschen am Schreibstil erkennen ?


Herr Doktor Klöbner
2020-10-22, 22:46:49
Menschen können das, ist mir gerade zum zweiten mal passiert, das mich jemand in einem anderen Forum erkannt hat, öhh... bist du nicht der Möchtegern Akademiker aus dem dem 3D Center Forum ?

Aber geht das beim heutigen Stand der Technik auch maschinell ? Wäre eine gut trainierte KI dazu in der Lage ?

Distroia
2020-10-22, 23:42:10
Würde mich sehr wundern, wenn dich jemand an deinem Schreibstil alleine erkennt; dafür ist er zu unauffällig. Lord Wotan und Dildo würden viele vermutlich schon erkennen. X-D

Ich glaube, in fünf Jahren oder vielleicht noch weniger werden KIs schon ziemlich darin sein. Ein bisschen bedenklich, dann dann wird es noch schwerer sein, sich zu verstecken.

Monger
2020-10-22, 23:55:33
Ich weiß von keiner KI die das macht, aber ich stelle es mir nicht allzu schwer vor. Wenn man alle Beiträge eines Users hier raus liest, ergibt sich viel Trainingsmaterial.
Als Mensch liest man aufgrund von Gewohnheit über vieles drüber ohne sich z.B. besonderer Wendungen bewusst zu werden. Das kann eine KI wahrscheinlich viel besser.
Wenn hier jemand Langeweile hat, kann er ja mal so ein Projekt anfangen.

LarsVegas
2020-10-23, 00:01:59
Aber geht das beim heutigen Stand der Technik auch maschinell ? Wäre eine gut trainierte KI dazu in der Lage ?
ja, es gab dazu sogar mal einen Vortrag auf dem CCC!

Rolsch
2020-10-23, 00:27:21
Google erkennt die User auch ohne Anmeldung im Browser an unzähligen Parametern wie Tippgeschwindigkeit, Tippfehler, Pausen, Schreibstil und was auch sonst noch so möglich ist.

Bei einem fertigen Text ist es natürlich schwerer, aber Dank Big Data sicher nicht unmöglich.

Flyinglosi
2020-10-23, 01:23:12
Beispiel: Face-Recognition „funktioniert“ im Labor, aber unter realen Bedingungen (im Rahmen der Überwachung von Bürgern) liegt die Fehlerquote bei über 50%, was ich als „nicht funktionieren“ bezeichnen würde. Mit Big-Data, neuralen Netzen, blablabla verbessert man natürlich die Chancen beim Raten, aber das wars auch schon. Man müsste also vorab definieren, wie hoch die Fehlerquote sein dürfte.

Cubitus
2020-10-23, 07:33:11
Ich vermute das sollte nicht so ein großes Problem sein..
wichtig ist der Daten Pool, wieviel Beiträge der User verfasst hatte...

Bzw. Deren Zuordnung und der Vergleich mit anderen Usern...

Satzbau, Wortschatz und Zeichen.. sind alles indirekte Marker.

Man könnte hier mit nem crawler das 3Dc penetrieren und sich selber nen Datensatz anfertigen...
Sobald das passiert ist, könnte man sich mit Tensor Flow sein eigenes Modell anfertigen...

GPU Power scheint ja hier durchaus massig vorhanden zu sein xD

https://www.tensorflow.org/

Shink
2020-10-23, 08:11:41
Würde mich sehr wundern, wenn dich jemand an deinem Schreibstil alleine erkennt; dafür ist er zu unauffällig. Lord Wotan und Dildo würden viele vermutlich schon erkennen.
So etwas wie "übliche Rechtschreibfehler", Satzbau, Satzlänge, Verwendung von ungewöhnlichen Wörtern, Satzzeichenverwendung, Füllwörter oder auch einfach nur die Themen, über die gerne gesprochen wird, geben sicher Hinweise drauf. Bin auch überzeugt, dass das schon jemand macht.
Schlimmstenfalls ist der Match nicht eindeutig. Keine Ahnung, was die Intention der Frage ist. Alternative zum Echtnamenzwang? Angst vor Überwachung?

Opprobrium
2020-10-23, 09:58:55
Google erkennt die User auch ohne Anmeldung im Browser an unzähligen Parametern wie Tippgeschwindigkeit, Tippfehler, Pausen, Schreibstil und was auch sonst noch so möglich ist.

Bei einem fertigen Text ist es natürlich schwerer, aber Dank Big Data sicher nicht unmöglich.

Während des Schreibens dürfte es um Welten einfacher sein. Wobei ich auf Anhieb behaupten würde, daß doch im Gegensatz zu den Feinheiten von Gestik, Mimik, Stimme etc. (man kann Menschen ja auch von hinten allein am Gamg erkennen) deutlich weniger Charakteristika aus den (digitalen) Schreibgewohnheiten herauszufiltern sind.

Da gibt es letztlich nur knapp über 100 Tasten, von denen viele äußerst selten benutzt werden. Zumal ohne spezielle Hardware auch Faktoren wie der Druck, den man zum Tippen auf die Tasten ausübt nicht erfasst werden.

Es dürfte in der Tat bei fertig geschriebenen Texten etwas einfacher sein, wobei ich auch da davon ausgehe, daß nur Extremerscheinungen (viele berühmte Autoren sind ja gerade durch ihren eigenwilligen Schreibstil bekannt: Hemmingway, Kafka etc.) wirklich zuverlässig erkannt werden können. Methoden dazu gibt es ja schon lange vor der großen KI Welle die wir gerade erleben: Zählen von Adjektiven, Substantiven, Verben, durchschnittliche Satzlänge, generelle Muster etc.pp. Ähnlich werden ja auch Bilder großer Maler analysiert.

Der großteil der Masse Mensch dürfte sich aber im mittleren Einheitsbrei der gaußschen Verteilungskurve befinden und recht schwer voneinander zu trennen sein, vor allem weil man sich ja auch nicht immer die gleiche Mühe beim Verfassen von Texten gibt (und der Schreibstil sich außerdem im Laufe des Lebens ändert). Wer eine Kurznachricht an Freunde schickt schreibt anders als die gleiche Person die eine E-Mail an den Arbeitgeber, einen Brief an entfernte Verwandte oder einen Beitrag in einem Forum verfasst.

Gerade wenn es um förmliche Schreiben geht herrscht zudem ja noch eine, im wahrsten Sinne des Wortes, Förmlichkeit, wodurch die Unterschiede im Schreibstil noch mal geringer werden dürften als in Texten die in privaten Angelegenheiten verfasst werden.

Deswegen werden ja auch immer mehr Journalisten (treffender wäre wohl Schreiberlinge) durch Software ersetzt, da es letztlich kaum einen Unterschied macht, ob die Zusammenfassung samt Endergebnis eines Sportereignis von einem Sport"journalisten" oder einer KI mit den üblichen Phrasen ausgestattet wird. Da reicht es dann schon, wenn einfach die Daten aus einem Liveticker eingespeist werden.

Wer z.B. mal den Football Manager gespielt hat wird schnell merken, daß die dort generierten Spielberichte sich nicht großartig von denen in der echten Sportpresse unterscheiden.

Hamster
2020-10-23, 13:10:51
Schreibstile plus Inhalt sollte eine gute Trefferquote haben.

Wenn man das 3DC z.B. als Trainingsplatform verwenden würde, würde man bestimmt viele User im restlichen Internet identifizieren können.

RaumKraehe
2020-10-23, 13:57:03
Menschen können das, ist mir gerade zum zweiten mal passiert, das mich jemand in einem anderen Forum erkannt hat, öhh... bist du nicht der Möchtegern Akademiker aus dem dem 3D Center Forum ?

Aber geht das beim heutigen Stand der Technik auch maschinell ? Wäre eine gut trainierte KI dazu in der Lage ?

Klar warum nicht. Ich denke das z.B. Facebook das schon massenweise macht um z.B. noch mehr über dich zu erfahren als du preisgeben möchtest.

Ich empfehle da mal die Netflix-Serie "Manhunt Unabomber". Da geht es z.b. unter anderem darum wie Sprache ein Teil des Profilings wurde.

Monger
2020-10-23, 14:42:41
Ich hab die Webseite vergessen, aber es gibt ja bereits einen Dienst, der die WhatsApp Verläufe von Verstorbenen nimmt, um eine KI zu entwickeln die so spricht wie eben der Verstorbene. Ergo, nicht nur dass man aus meinen x-tausend Beiträgen hier meinen Stil erkennen könnte um woanders danach zu suchen - man könnte eine KI auch trainieren so selbst zu schreiben. Ihr würdet also evtl. nicht mal merken wenn ich jetzt schon tot wäre.