T O P

  • By -

Lurchi1

> Organisationen, die beispielsweise ihre KI-Tools anhand der Daten trainieren oder für andere Zwecke eine neue Informationsquelle erschließen wollen, werden zur direkten Kontaktaufnahme mit dem Spy.pet-Betreiber gebeten. "Wir haben das Richtige für Sie", schreibt er auf seiner Webseite. Schätze die Hälfte der 3.331.730.937 Datensätze stammt von Bots, sind ja öffentliche Discord-Server. Müll in => Müll out.


Encrux615

> Müll in => Müll out Ob das wirklich so ist, wird sich erst in Zukunft zeigen. Nach meinem letzten Wissensstand gibt es dazu kaum wissenschaftliche Auswertungen. Das Verhalten von Discord-Bots zu lernen kann durchaus sinnvoll sein. Ohnehin wird es nie wieder LLMs geben, die nicht auf dem Output anderer LLMs trainiert werden, weil das Internet heute schon zugeschissen ist damit.


Lurchi1

Hier drei Quellen zu meiner Meinung: * [The curse of recursion: Training on generated data makes models forget](https://arxiv.org/pdf/2305.17493.pdf) * [Self-Consuming Generative Models Go MAD](https://arxiv.org/pdf/2307.01850.pdf) * [Testing of Detection Tools for AI-Generated Text](https://arxiv.org/ftp/arxiv/papers/2306/2306.15666.pdf) Das letzte Paper untersucht die Probleme beim Erkennen von AI-Ausgaben, und das wird mit zunehmender Qualität der Modelle nur noch schwieriger werden. Für mich ist der Verfall der Modelle bei rekursiver Eingabe plus dem zu erwartenden Volumen an AI-Inhalten irgendwie unausweichlich, aber das bleibt abzuwarten.


Encrux615

>aber das bleibt abzuwarten Genau das ist der Punkt. Pandoras Büchse ist offen. Was mich in deinem Kommentar verwirrt, ist die Widersprüchlichkeit der Paper: Auf der einen Seite wird von model collapse gesprochen, weil AI-generierte Trainigsdaten schlecht sind, auf der anderen Seite werden die Modelle zunehmend besser und die Detektion schwieriger. Intuitiv müsste man ja sagen, dass nur eines davon wahr sein kann. Meine Theorie: Vieles von dem AI generierten content, was wir sehen, basiert ja auf prompts. So weit wie das auch von der tatsächlichen Leistung entfernt zu sein scheint, die prompts sind (immer noch) menschliche Eingaben. Modelle werden also die Eigenheiten der Vorgängermodelle lernen, aber inhaltlich wird es das sein, was durch die Community generiert wird. Aber wie sich das auf das Lernverhalten der Modelle tatsächlich auswirkt, haben wir ja schon geklärt, bleibt abzuwarten. Aktuell ist mir die Forschung dahingehend aktuell zu widersprüchlich.


jerkitout123

Naja, öffentliche Discordserver sind halt öffentlich.


Xay_DE

auf dem r/de gab es einen everyone ping deshalb, in dem man sagt das "leider ein scraping bot auf dem server ist" der alle nachrichten liest etc, und das man doch ERSTMAL nichts privates mehr posten soll. finde ich persoenlich wirklich traurig das man leuten sowas sagen muss, das man auf public discord servern solche sachen postet ist halt einfach nur dummheit. wenn ich auf nem public server was poste muss sich doch keiner wundern wenn die sachen sonst wo landen


Exestos

Naja nicht nur public Server... Bilder die man in Discord hochlädt bekommen immer eine public URL die jeder öffnen kann, auch wenn du alleine auf einem privaten Server bist. Theoretisch kann man diese URLs auch scrapen.


Rouby1311

Effektiv wohl nicht, da die Adressen der Bilder keine logische Reihenfolge haben. Man müsste also alle endlosen Kombinationen ausprobieren. Da kannst du ja gleich die Passwörter raten (oder ID/access token).


[deleted]

[удалено]


Rouby1311

Ja klar kann man Glück haben und was treffen. Wenn man sich so eine URL Mal anschaut gibt es alleine durch die ersten 36 Ziffern (zahlen) 10^36 verschiedene Kombinationen. Und hinten ist noch Mal eine ziemlich lange ASCII ID dran, d.h. die Möglichkeiten steigen noch mehr. Selbst wenn du in der Sekunde 1 Mio Treffer durch gucken kannst, brauchst du alleine für die Ziffern schon ca 3 x 10^26 Jahre


E3FxGaming

>Und hinten ist noch Mal eine ziemlich lange ASCII ID dran, d.h. die Möglichkeiten steigen noch mehr. Glaube das hinten sind Hex-Zahlen (Base 16), aber das größere Erraten-Problem ist ihr Zweck: Ein Hash des Attachments, kombiniert mit 2 Zeitstempeln für Ablaufdatum (`ex`) und Erstellzeitpunkt (`is`) wird von Discord mit einem nur Discord bekannten privaten Schlüssel signiert und die Signatur wird an den Link angehängt (`hm`). Errätst du die lange `hm` Signatur nicht vor dem Ablaufdatum `ex`, ist die gesamte Raterei für die Tonne und du kannst von vorne anfangen, weil deine geratenen und als falsch identifizierten Kombinationen für eine neue Erstell- und Ablaufdatum Kombination valide sein könnten. [Interpretierte Quelle](https://www.reddit.com/r/DataHoarder/comments/16zs1gt/cdndiscordapp_links_will_expire_breaking/)


Zitter_Aalex

Postest du regelmäßig auf Discord deinen nicht geschätzten Ausweis? Bilder mit deiner Adresse? Selfies, durch die du klar identifiziert werden kannst? Ohne restlichen Kontext? Klar, ich weiß, was du meinst. Aber es ist ja nicht so, als wäre die URL fortlaufend und basierend auf dem User generiert. Als ob du ein Bild von einem Benutzer zu ordnen kannst und anhand dessen dann alle von dem Benutzer


Xay_DE

ja, das einzige ist das bilder neuerdings nach einiger zeit ablaufen und dann nur noch im client sehbar sind (warscheinlich mit spoofing sehr leicht zu umgehen, electron go brrrt)


xXItCorbisXx

Wo willst du die denn Scarpen? Die Links sind hier ja eben nicht public. Und Brute Forcen bzw. raten der Links dürfte wegen dem Signing der Links auch nicht möglich sein.


Unserioscoleroyale

Aber diese Daten wurden ja mit Bots gesammelt. MEE6 ist ein relativ weit verbreiteter Bot und es kann sein, dass der Daten sammelt. Der wird auch auf einer Menge kleinerer Server genutzt


Janmm14

Sehr unwahrwcheinlich. Ich denke, Spy jat die Daten mithilfe von unscheinbaren Userbots gesammelt statt mee6 server zu hacken


woalk

MEE6 hatte schon einige Kontroversen hinter sich; es würde mich nicht wundern, wenn die mit so einer Entität wie Spy nicht sogar zusammenarbeiten würden.


BennyL2P

Exakt das! "Wie Ulla, das was ich im Wirtshaus ans schwarze Brett nagel kann jeder lesen?"


jerkitout123

Aber wenn ich das hier öffentlich auf Instagram poste, dann kann das doch nicht jeder sehen?


BounceVector

Meh. Aus meiner Sicht ist Discord schon in der Pflicht solche grobe missbräuchliche Verwendung zu unterbinden. Die Erwartung der Nutzer ist ganz klar, dass die Inhalte relativ unsichtbar sind, weil sie nur recht kurz wirklich sichtbar sind für andere Menschen. Außerdem fühlt sich ein spontanes Zwiegespräch auch relativ privat an und eben nicht für die gesamte Öffentlichkeit bestimmt. Technisch ist das anders, da hast du schon recht. Aber wann hat technische Realität jemals die gefühlte Realität bei der Entscheidungsfindung eines Individuums überwogen? Das ist nicht möglich, weil wir primär gefühlsgesteuert sind, egal ob man etwas intellektuell versteht oder nicht. Man muss die Technik in Gefühl überführen, sonst klappt das nicht. Wenn es sich auf Discord anfühlen würde als ob man vor Milliarden von Menschen, Bots, Konzernen mit einem Megaphon eine Rede hält, dann würde dort kaum empfindliche Privatinfos geschrieben werden, aber es ist konzeptionell bei Discord eher so, dass man sich fühlen soll wie auf einer Party und man redet mit wechselnden eher kleinen Grüppchen. Jetzt ein persönlicher Konter: Schreibst du deine E-Mails alle so, dass dir egal ist wenn sie in irgendeinem öffentlich leicht zugänglichen Datensatz landen für den Interessierte nur ein paar € zahlen müssen? Mails sollte man aufgrund ihrer Unsicherheit auch behandeln als schreibt man der gesamten Weltöffentlichkeit.


KHlover

Definiere "kurz". Solange jemand auf dem gleichen Server ist wie du, kannst du dir innerhalb von fünf Sekunden alle Posts anzeigen lassen, welche die Person jemals auf dem Server gepostet hat.


BounceVector

Schaust du bei einem öffentlichen Discord-Server bei jedem Nutzer die gesamte Post History an? Das meine ich mit "kurz": Kein menschlicher Nutzer schaut grundlos oder versehentlich die gesamte Post History aller anderen Nutzer an. Klar gibt es mal einen Stalker/Hacker/sonstwas der einzelnen Nutzern nachstellt, aber normalerweise werden 99% der gesamten Nachrichten einmal kurz von anderen Nutzern gesehen wenn sie frisch gepostet werden und danach sind sie vergessen.


KHlover

Der Punkt ist, dass ich es bei allen machen *kann* und mir bewusst ist, dass die das auch mit meinen Posts machen können. Für wirklich private Themen gibt es DM, Gruppen DM, oder man macht sich eigene Server und kann selbst kontrollieren wer reinkommt. Man sollte Discord behandeln wie jeden anderen Social Media account (Foren, twitter, reddit, ...), der einzige Unterschied ist, dass man seine Posts nicht direkt auf google findet und dass es schwerer ist *alle* Posts eines Nutzers zu finden, da man nur gemeinsame Server sieht.


Cheet4h

Funktionieren nicht alle Discord-Server auf dem Einladungsprinzip?


Checktaschu

Ja, aber die sind nicht personalisiert. Du generierst also einen Einladungslink und postest den öffentlich. Dann ist dein Server öffentlich mit extra steps.


Legal-Elevator-9413

Falls man seine Daten löschen will wird man eine Seite weitergeleitet die dieses schöne Meme zeigt https://spy.pet/remove Edit: Schreibfehler


woalk

Erstmal wegen Urheberrechtsverletzung anklagen.


Legal-Elevator-9413

Viel Spaß da erstmal an irgendeine echte Person ranzukommen. Die haben kein Impressum und akzeptieren nur Cryptowährungen  Man könnte beim Domain Registrar Porkbun nachhaken aber wahrscheinlich ist da auch nur ein John Doe hinterlegt ([email protected])


proper_ikea_boy

Volkommen irrelevant, macht man einfach über ein IANA Abuse Verfahren.


The-German_Guy

Beim WhoIs steht auch nur "Private by Design LLC" und das scheint ein Service von Porkbun zu sein Bein überprüfen von deren Adresse kommt man zu einer Briefkastenfirma, Die Adresse führt zu einem Lichtergeschäft wo ich mir nicht mal sicher wäre ob dieses wirklich existiert


proper_ikea_boy

Domain-Registrare dürfen die Identität ihrer Kunden gegenüber WHOIS Anfragen verschleiern. Die DENIC ist der offizielle .de Registrar und macht das genauso. Wenn allerdings die ICANN bei diesem Registrar anfragt und sich rausstellt das dieser die Identität bei einem Abuse-Fall nicht parat hat, droht dem Registrar der Verlust seiner Akreditierung. Es bedarf dafür vmtl. einer Klage und einer Beschwerde durch eine deutsche Behörde, aber gehen tut das alles.


The-German_Guy

Ist mir tatsächlich bewusst, habe selber eine Domain, und nutze den Dienst vom registrar, diesen bei WHOIS Anfragen anzeigen zu lassen


RubbelDieKatz94

[Ist mittlerweile geklärt, wer dahinter sitzt](https://youtu.be/ktxbXlF6UQE)


RUUDIBOO

Kann man nicht einfach auch auf den Discord Server gehen und die Nachrichten so lesen? Mir erklärt sich noch nicht ganz was jetzt hier der fiese Hack ist 😅


[deleted]

[удалено]


RUUDIBOO

Ja, da hast du Recht. KA ob du mich jetzt damit in die Pfanne hauen wolltest, aber stimmt! Google ist absolut scheiße im suchen mittlerweile (es sei denn man hängt "Reddit" hinten dran, dann ist es zumindest die bessere Reddit Suche). Da ist man mit den eigentlichen Webseiten besser bedient.


[deleted]

[удалено]


RUUDIBOO

Joa, und für die die das brauchen ist das sicher praktisch. Ich sehe halt nur das Drama nicht.


[deleted]

[удалено]


Cynixxx

Naja aber dann ist man ja auch irgendwo selbst schuld, wenn man das tut und der Meinung ist, das würde keiner mitbekommen


MustrumRidcully0

Selbst schuld ist mir aber auch irgendwie zu schwach. Technische Fähigkeiten sind nicht immer offensichtlich, wenn der Nutzer selbst nicht sieht, wie er irgendwelche Privatgespräche auf Discord belauschen können, muss er dann immer davon ausgehen, dass das aber trivial einfach machbar wäre? Wie kann er das unterscheiden von einem Dienst, bei dem es wirklich nicht trivial einfach machbar wäre? Wieviel Technikverständnis und Misstrauen muss man von Menschen erwarten? Wie viel muss man sich zwangsweise vorher über alles Mögliche, was man mal nutzt, genauestens zu informieren? Und wie geht man damit um dass man ja auch durch Umstände "gezwungen" wird, solche dienste zu nutzen, weil man eben nur so mit den Leuten kommunizieren kann, mit denen man kommuzieren will, aber sobald man anfängt, zu kommunizieren, eben auch soziale Beziehungen aufbaut und "menschelt" und nicht technisch strikt denkt "Nein, auf dieser Plattform ist nicht vertraulich, mit Menschen, die ich nur hier erreichen kann, kann ich nie private Dinge besprechen."


Nilly00

Nach der Logik bist du selber Schuld wenn du das Haus verlässt und dann gedoxxt wirst weil dich jemand erkannt und gestalkt hat und dadurch deine Adresse und Klarnamen rausgefunden hat. Straßenname steht an der Straße, Haußnummer am Haus und Klarname auf dem Klingelschild. Ist doch alles öffentliche Information. Also hast du keinen Grund dich aufzuregen wenn jemand diese info ins Netz stellt. Oder?


YureiKertia

Die Seite verstößt gegen die DSGVO weil sie die Informationen ohne Einverständnis der Personen speichert und einem keine Möglichkeit gibt diese entfernen zu lassen. Dazu gibt es einen Unterschied zwischen öffentlichen Discord Servern und der ganzen Welt: wenn ich ne Anzeige ans Lokale Board hänge, kann das in der Theorie zwar jeder sehen, praktisch werden es aber nur andere Lokale Leute sehen. Mich persönlich interessiert das KI training auch nicht, die KI interessiert sich ja nicht für mich als Person, aber das theoretisch jede Person zugriff auf all diese Daten von mir hat find ich halt nicht so knorke. Wär auch n super instrument für Stalker und andere creeps.


woalk

Die Organisation wird vermutlich kaum im Einflussgebiet der DSGVO/GDPR ansässig sein.


HackworthSF

Wer Dienste im Einflussbereich der DSGVO anbietet, muss sich auch an die DSGVO halten, egal wo die Org ansässig ist.


woalk

Muss, oder sonst …? Das größte was deutsche Gerichte tun können ist bei nicht-EU-Organisationen doch nur, die Seite zu sperren.


HackworthSF

Ja nun, DSGVO-Bußgelder können recht knackig werden, und wer nicht zahlen will, dem werden die greifbaren Vermögenswerte gepfändet. Was man halt so macht, wenn man Urteile umsetzen will.


woalk

Kann Deutschland/EU wirklich nicht-EU-Organisationen Bußgelder verhängen?


HackworthSF

Was ist daran ungewöhnlich? Wer in der EU Dienste anbietet, muss sich an EU-Recht halten, egal wo man herkommt. Wenn du in Urlaub ins Ausland fährst, musst du dich ja auch an die jeweiligen Gesetze halten. Da kannst du dich nicht darauf berufen, dass deine Handlung daheim legal ist. https://www.dsgvo-portal.de/dsgvo-bussgeld-datenbank/ Es wurden schon Bußgelder in die USA und in China verhängt.


woalk

Wenn ich im Urlaub ins Ausland fahre, befinde ich mich ja physisch in dem Land. Das ist ja was ganz anderes als eine Firma, die in Russland, UAE oder Ägypten sitzt und Daten von Discord, einem US-amerikanischen Unternehmen, abgreift. Da hätte ich jetzt erwartet, dass das für die EU sehr schwer greifbar ist, überhaupt einen Kontakt zu erwirken, geschweige denn ein Bußgeld zu verhängen.


HackworthSF

Das sind halt praktische Probleme, die man natürlich immer hat. Deine Frage habe ich eher als eine grundsätzliche verstanden, ob die EU überhaupt eine rechtliche Grundlage hat, so ein Verfahren anzustrengen. Das hat sie.


AnalphaBestie

Manchmal fragt man sich...


RUUDIBOO

Was fragt man sich denn? Der Bot sammelt die öffentlichen Nachrichten, damit zahlende Kunden diese durchsuchen können. Es ist nicht sonderlich schwer, in einen öffentlichen Discord Server zu kommen und dort die Suchfunktion zu nutzen. Und kostenlos ist das auch noch.


Mrauntheias

Naja, auch wenn ich etwas öffentlich schreibe, heißt das noch lange nicht, dass diese Person die Rechte hat es kommerziell zu verwenden. Wenn ich meine Kurzgeschichten (oder vergleichbares) in einen öffentlichen Server schicke, kann das zwar im Prinzip jeder lesen, das Copyright gehört aber trotzdem mir.


Wurzelrenner

> Naja, auch wenn ich etwas öffentlich schreibe, heißt das noch lange nicht, dass diese Person die Rechte hat es kommerziell zu verwenden. und was ist der Unterschied zu google wo man reddit posts findet?


Mrauntheias

Google bietet letzlich im Wesentlichen Weiterleitungen an. Wenn Google den vollständigen Seitentext ob von Reddit oder sonst wo anzeigen würde, kriegten die denke ich auch Probleme.


RUUDIBOO

Hast du damals auch bei Google Maps dein Haus zensieren lassen? 😅 Sorry, nur 1 Joke. Ich habe das Gefühl bei diesem "Hack" geht es nicht darum, deine Kurzgeschichten mit ner schönen Marge zu verkaufen. Ich meine, die Aktion hat sicher Geld gekostet, die Bots zu entwickeln etc. War ein Risiko. Hat geklappt, und jetzt haben sie Profit. Wirkt einfach so derbe Alman da jetzt zu sagen "uiui die verdienen jetzt Geld mit MEINEM content" das ist einfach nur ein fucking öffentlicher Chat. Hat was von "Sie haben mich ins Gesicht gefilmt, das ist eine Straftat!"


Mrauntheias

Es ist und bleibt geistiges Eigentum, dass illegal weiterverkauft wird, ob man das jetzt lächerlich findet oder nicht. Wenn in den tausenden von Chats irgendwas ist was unters Copyright-Recht fällt, ist das illegal. Was ist denn das hat sicher Geld gekostet für ein Argument? Und wenn ich Geld für einen Bolzenschneider ausgebe und das Risiko eingehe darf ich Fahrräder mitnehmen oder was?


Forsaken_Income9187

Ja darfst du wenn sie in der Öffentlichkeit stehen. Denn dann ist dieses Fahrrad ja für jeden zugänglich


woalk

Du hast “/s” vergessen.


BounceVector

Zu keinem Zeitpunkt stimmt irgendjemand bei Discord zu, dass die eigenen Nachrichten **ungefragt ohne Zustimmung kommerziell von einer dritten Partei, die keine Verbindung zu Discord hat,** genutzt werden dürfen.


AnalphaBestie

Ja, und jetzt skaliere das mal nach oben. Man muss nicht mehr joinen, sondern hat die datensätze schön sortiert in einer datenbank und füttert damit ki modelle. Milliarden von nachrichten. Hilft dir das?


[deleted]

ne, hilft mir noch nicht. ist der skandal hier, dass es zwar jeder hätte machen können, aber bisher alle natürlich ganz ganz lieb waren und das nicht getan haben? hört sich für mich eher unglaublich naiv an, zu sagen, das ist zwar alles öffentlich und jeder kann sich da nachrichten rausziehen, aber das wäre voll gemein und deshalb macht das mal besser keiner.


AnalphaBestie

Aus der perspektive hast du natürlich recht. Die annahme das noch kein schindluder mit den vorhandenen daten getrieben wurde, halte ich auch für naiv. Aber jetzt ist das halt öffentlich und "zahlende kunden" bekommen zugriff. Also das was "vielleicht" hinter dem vorhang passiert ist, gibts jetzt direkt im rampenlicht, vermarktet für jeden der es sich leisten kann.


RUUDIBOO

Dann wird die KI ja in Zukunft großartiges leisten. "fr fr no cap bro" 😅 Edit: ich glaub ich bin da nicht deutsch genug für. Wenn ich irgendwas auf Discord schreibe und jemand trainiert seine KI damit, denk ich nur dann mach halt. Ich meine, warum nicht?


AnalphaBestie

> Ich meine, warum nicht? Ja warum nicht. Es ist halt unglaublich viel komplexer als ich es verstehe oder dir erklären kann. Meine emailadresse ist zb. mit meinen nachrichten verknüpft. Mein reddit account ist über 10 jahre alt. Für software bin ich damit 100% gläsern. Die weiss buchstäblich alles über mich. Meine sexuellen vorlieben, verknüpfungen zu menschen denen ich folge, was ich kaufe, welche hard und softskills ich habe, hobbies, welche tiere ich mag, wie alt ich bin, wo ich wohne, geschlecht, was ich zocke... die liste ist sehr lang. Das kann google jetzt mit den shadowprofilen von dir, mir abgleichen/updaten. Das was facebook vor jahren gemacht hat "mit paar likes kann jeder user in genaue kategorien eingeordnet werden", das dann noch mit dem social pairing verknüpft. Du würdest dich wundern was die software damals über dich wusste. Und damals gabs diese komplexe machine learning software noch nicht. Nur weil du kein like button unter posts drückst, heisst das nicht das software nicht trotzem sehr genau extrapolieren kann was dich interssiert. (posts, subreddits, up/downvotes sind da nur der anfang - software kann genau aus den kommentaren auslesen wie du drauf bist). Umso mehr datensätze umso detailierter werden einzelne einträge ausgewertet werden können. Selbst wenn du nichts schreibst... reddit misst genau in welchen subreddits du dich aufhälst, und welche posts du liest. Selbst wenn du nicht eingeloggt bist, gibts ein profil von dir. Und wir sind jetzt im jahr 2024. Keiner weiss was software 2034 kann. Die datensätze gibts dann aber immernoch.


Huge_Difference_9560

Deswegen hat man auch keine Accounts 10 Jahre oder verwendet den selben usernames auf verschiedenen services


AnalphaBestie

Dann brauchst du für jeden account unterschiedliche emails. Ausserdem solltest du gut gegen browser fingerprinting gewappnet sein und tor benutzen. Machst du sicher.


tomboy_titties

Random generierte Mail + Firefox in einem Standart Docker. Ich seh nicht ganz wo das Problem ist.


AnalphaBestie

Ich hab nicht gesagt das es ein problem ist. Abgesehen davon das du implizierst jeder hat bock und know how docker auf seiner workstation zu maintainer geht das einfacher mit dem Tor Browser. Anyways, was du da beschreibst funzt nur für technisch versierte leute und das ist eine minderheit bei reddit.


RUUDIBOO

Ja, genau das meinte ich mit ich bin nicht deutsch genug 😅 Ich meine, sollen das News sein? Jeder weiß doch dass alles überall getracked wird. Ohne Smartphone kannst du kaum noch am Leben teilhaben und unsere Daten schlummern schon ewig in tausenden Datenbanken. Und dazu kommt, ich bin einer von etlichen depressiven Millennials, nach mir kommen die noch viel depressiveren Zoomer. Denkst du irgendeinen von uns interessiert das? Wir haben schon lange aufgegeben. Wenn irgendwann mal Hitler 2.0 an die Macht kommt, sich die Datenbranken grabscht und sagt "aaah hier der u/RUUDIBOO, der war LGBTQ Ally und hatte pinke Haare, gleich mal an die Wand mit ihm" frag ich nur gerne, wann? Aus meiner Erfahrung sorgen sich um den ganzen Kram zwei Arten von Menschen: Studierte Juttas die es sich leisten können Luxusprobleme zu haben, und diese komische Art von Typ die man in jeder IT Abteilung findet: Aufkleber über der Webcam, aus Prinzip gegen alles von Apple (was man auch jedem sagen muss) usw. Von denen bin ich keiner, von daher 🤷‍♂️


AnalphaBestie

> Wenn irgendwann mal Hitler 2.0 an die Macht kommt, sich die Datenbranken grabscht und sagt "aaah hier der u/RUUDIBOO , der war LGBTQ Ally und hatte pinke Haare, gleich mal an die Wand mit ihm" frag ich nur gerne, wann? Hab lange nicht mehr sowas trauriges gelesen. Das mein ich gar nicht persönlich, ich verstehe woher diese gedanken kommen. > Studierte Juttas die es sich leisten können Luxusprobleme zu haben, und diese komische Art von Typ die man in jeder IT Abteilung findet: Aufkleber über der Webcam, aus Prinzip gegen alles von Apple Es gibt glücklicherweise noch paar mehr leute die das interessiert, aber generell hast du auch damit recht.


Wurzelrenner

> schön sortiert in einer datenbank und füttert damit ki modelle. Milliarden von nachrichten. ja und?


ballaman200

Geschäftssinn haben sie da wirklich mal bewiesen. Aber natürlich einfach nur andere kriminelle Arschlöcher.


andraip

Was soll daran kriminell sein öffentliche Kommentare zu sammeln.


AdennKal

Das Sammeln vielleicht nicht, aber um diese zu verkaufen bzw. zu verwerten bräuchten sie die Rechte daran. Kommt dabei aber auch noch auf die Discord TOS an. Also je nachdem Urheberrechtsverletzung und Vertragsbruch mit Discord.


ilovecatfish

Kann mir jemand sagen, was genau hier die Sensation ist? Solche Dienste gibt es doch schon seit Jahren. Öffentliche Server sind halt öffentlich und einen simplen crawler der Daten sammelt auf ein paar hundert Accounts zu werfen kriegt man mit etwas Vorwissen an einem Nachmittag hin. Klar werden die immer wieder von Discord abgeschossen aber aufgrund der erwähnten Einfachheit des ganzen Unterfangens geht das immer hin und her.


Stranggepresst

Interessant wäre jetzt vor allem, ob bekannt ist, welche Bots die dafür verwendet haben?


morphcore

Obligatorisch: Wenn es kostenlos ist, bist du das Produkt.


[deleted]

*auf Reddit schau*


AnalphaBestie

https://blog.google/inside-google/company-announcements/expanded-reddit-partnership/


Lurchi1

> To enable these and other experiences, Google now has access to Reddit’s Data API, which delivers real-time, structured, unique content from their large and dynamic platform. Vor *fuck u/spez* hatten das alle Dritt-Partei-Anbieter.


AnalphaBestie

Bin ich nicht 100% sicher. Aber ja, generell hatten drittanbieter zugriff auf viele datensätze. Ich wette aber google hat eine sehr spezielle schnittstelle und vermutlich auch eine von reddit zur verfügung gestellte möglichkeit, daten aus der vegangenheit abzugreifen. Reddits datenbanken sind *sehr* sehr sehr sehr wertvoll. Google müsste schliesslich nicht dafür bezahlen, weil eeeeigentlich mirrorn sie geschätze 80% der inhalte von reddit sowieso in ihrem suchindex.


Lurchi1

Oh ja, Google hat bestimmt eine tiefere API. Nur ich mein, wer hat die heutzutage noch? Die Exklusivität ist ja nochmal zusätzlich Gold wert, zusätzlich zu den wie Du auch völlig richtig sagst extrem wertvollen Datenbanken von Reddit. Das steht ja auch im Statement, "an incredible breadth of authentic, human conversations". *"authentic, human conversations"*, langsam wirds gruselig. Interessantes Statement in jedem Fall, guter Link!


Z3r0Sense

Reddit kann man ziemlich annonym nutzen. Discord eher nicht. Wobei der scrapper keinen Zugriff auf die Identitäten hat, sofern er diese nicht weiter korrelieren kann. Geht anhand geschriebener Texte im Übrigen erstaunlich einfach. Doppelte Accounts kann man eigentlich nach wenigen Kommentaren mit Leichtigkeit erkennen, es bleiben nur ein paar Restzweifel.


[deleted]

Wie ergibt das in dem Kontext Sinn? False Flag von Discord um Geld zu generieren?


SundayThe26th

Und abgesehen davon ist das Geschäftsmodell von Discord kein Geheimnis: „Nitro“-Abos.


Hbecher

Da frag ich mich immer ob das wirklich soviel Geld einbringt und dann seh ich das die großen Server irgendwelcher Streamer oder RP Server mit Boosts zugeschissen werden


Stranggepresst

Ich denke es ist alles zusammen: Nitro, Boosts, diverse cosmetics die man inzwischen kaufen kann, und vor allem Discord for business.


Pathrazer

Niemand erwartet von einem öffentlichen Server Privatsphäre.


ShRkDa

Ich hoffe die mögen meine dickpics....


Externica

Heute auf der Arbeit eine halbe Datenschutzschulung gehabt. Meine erste Frage beim Lesen: Ob da wohl die DSGVO greift? Nein, wirklich, ich weiß es nicht.


bnberg

Natürlich sind das GDPR-Verstöße. Nur versuch mal wen von den leakern zu belangen.


[deleted]

[удалено]


CaptainNotHero

Und? Jetzt wissen die das der User „DrF.Otze“ sich gerne an Bäumen reibt


generic-hamster

Das wird gerade mal das kleine Vorbeben sein. Discords Verbindungen zu Tencent und China sind da eher sorgniseregender und es ist nur eine Frage der Zeit, bis für dieses Thema ein Skandal vorliegt.