Alle Beiträge von Dirk Bongardt

Seit 1998 Journalist, habe ich alle bisherigen Phasen des digitalen Wandels in unserer Branche miterlebt. Von der Art, wie wir recherchieren, über unsere Möglichkeiten und Werkzeuge, Geschichten zu erzählen bis hin zu der Art, wie unsere Rezipienten unsere Inhalte aufnehmen, ist nichts davon unberührt geblieben. Als Dozent helfe ich angehenden Online-Redakteuren, das Wissen um diese Möglichkeiten und Fakten für ihre Arbeit zu nutzen.

Samsung plant Milliarden-Investition: Perplexity AI soll Google verdrängen

Samsung will Perplexity AI als Standard-Assistenten auf Galaxy-Geräten etablieren und Milliarden investieren.

Samsung steht kurz vor einem weitreichenden Deal mit dem US-KI-Startup Perplexity AI. Geplant ist, die Perplexity-App künftig auf Samsung-Smartphones vorzuinstallieren und tief in den Samsung-Browser sowie den Sprachassistenten Bixby zu integrieren. Besonders im Fokus steht die kommende Galaxy-S26-Serie, die 2026 erscheint: Hier könnte Perplexity erstmals als Standard-Assistent eingesetzt werden und so Googles Gemini-Assistenten in den Hintergrund drängen.

Finanziell will Samsung eine führende Rolle in einer neuen Finanzierungsrunde übernehmen, bei der Perplexity rund 500 Millionen Dollar einsammeln und mit 14 Milliarden Dollar bewertet werden soll. Die Partnerschaft soll Samsung helfen, seine Abhängigkeit von Google zu reduzieren und die KI-Strategie flexibler aufzustellen – ähnlich wie Apple, das ebenfalls Interesse an Perplexity zeigt.

Neben der Software-Integration diskutieren beide Unternehmen über ein KI-basiertes Betriebssystem und eine App, die verschiedene KI-Assistenten bündelt. Offiziell bestätigt ist der Deal noch nicht, die Ankündigung wird aber für dieses Jahr erwartet.

Forensik: KI rekonstruiert Gesichter aus der DNA

Blutspuren am Tatort, Hautreste eines Täters unter den Fingernägeln eines Opfers, im Wald verscharrte Überreste – per DNA-Probe ließ sich die Identität von Opfern oder Tätern bislang nur bestimmen, wenn die Forensiker eine Vergleichsprobe der in Frage kommenden Personen hatten. Mit einer noch in der Entwicklung befindlichen KI-Lösung könnte künftig ein Foto der Person genügen.
Chinesische Forscher haben mit „Difface“ eine KI-Software entwickelt, die aus DNA-Proben das 3D-Gesicht einer Person rekonstruieren kann. Grundlage sind genetische Variationen (SNPs), die mit 3D-Scans von knapp 10.000 Probanden verknüpft wurden. Das System analysiert Zusammenhänge zwischen Genom und Gesichtsstruktur und erzeugt daraus eine Punktwolke, die das Gesicht abbildet. Die durchschnittliche Abweichung zum echten Gesicht beträgt nur 3,5 Millimeter, mit zusätzlichen Parametern wie Alter oder Geschlecht sinkt sie auf 2,9 Millimeter.

Die Software kann sogar Altersstufen vorhersagen, allerdings sind nicht alle Gesichtsbereiche gleich exakt rekonstruierbar. Difface funktioniert bislang nur zuverlässig bei Han-Chinesen. Haupteinsatzgebiet sehen die Entwickler in der Forensik: Ermittler könnten Gesichter von Verdächtigen oder Opfern anhand von DNA-Spuren nachbilden. Auch Historiker und Mediziner könnten profitieren. Die Forscher warnen jedoch vor erheblichen Auswirkungen auf die Privatsphäre und fordern eine breite gesellschaftliche Debatte.

Ein wichtiger Thriller: „Views“ von Marc-Uwe Kling

In seinem Werk Views (bezahlter Link) verlässt Marc-Uwe Kling die humorvollen Gefilde der „Känguru-Chroniken“ und betritt das Terrain des politischen Thrillers.

Inhalt

Die 16-jährige Lena Palmer verschwindet spurlos. Drei Tage später taucht ein verstörendes Video auf, das ihre Vergewaltigung zeigt und sich rasend schnell in sozialen Netzwerken verbreitet. BKA-Kommissarin Yasira Saad übernimmt die Ermittlungen. Während sie versucht, Lena zu finden und die Täter zu identifizieren, eskaliert die Situation: Eine rechtsradikale Gruppierung namens „Aktiver Heimatschutz“ gewinnt an Zulauf, und gewalttätige Demonstrationen erschüttern deutsche Städte. Die Grenzen zwischen Realität und Inszenierung verschwimmen zunehmend.

Gesellschaftliche Strömungen und technologische Entwicklungen

Kling thematisiert die Macht sozialer Medien, die Verbreitung von Desinformation und die Rolle von Algorithmen bei der Meinungsbildung. Er zeigt, wie leicht sich die öffentliche Meinung manipulieren lässt und wie schnell sich Hass und Gewalt verbreiten können. Die Gefahr von KI-generierten Inhalten wird ebenfalls beleuchtet. Der Roman wirft Fragen zur Authentizität von Informationen und zur Fragilität demokratischer Strukturen auf.

Warum Leser das Buch schätzen oder nicht

Views bietet eine spannende Handlung mit unerwarteten Wendungen und einer starken Protagonistin. Klings Erzählstil bleibt flüssig und zugänglich, auch wenn ernste Themen im Mittelpunkt stehen. Wer sich für gesellschaftliche Entwicklungen und technologische Auswirkungen interessiert, wird das Buch als anregend empfinden. Ich empfand das Ende allerdings als zu abrupt und einige Figuren als zu flach gezeichnet.

Fazit

Mit Views (bezahlter Link) gelingt Marc-Uwe Kling ein fesselnder Thriller, der aktuelle gesellschaftliche und technologische Themen aufgreift. Trotz kleiner Schwächen bietet der Roman eine spannende und nachdenklich stimmende Lektüre. Ein Buch, das Leser zum Reflektieren anregt und die Gefahren unserer zunehmend digitalisierten – und mehr und mehr von KI gestalteten – Welt aufzeigt.

Deepmind-Mitarbeiter rebellieren: Gewerkschaft gegen Militär-KI

Rund 300 Beschäftigte des KI-Forschungsunternehmens Google Deepmind in London streben einen Beitritt zur Gewerkschaft Communication Workers Union (CWU) an. Auslöser ist die Entscheidung des Mutterkonzerns, KI-Technologien an Rüstungskonzerne zu verkaufen und Kooperationen mit der israelischen Regierung – etwa im Rahmen von Projekt Nimbus – zu pflegen. Besonders kritisch sehen die Mitarbeiter die Aufhebung eines früheren Google-Versprechens, keine KI für Waffen oder Überwachung zu entwickeln.

Einige Angestellte befürchten, ihre Arbeit könne im Gaza-Konflikt militärisch eingesetzt werden. Fünf Mitarbeiter haben bereits aus Protest gekündigt. Ein im Mai eingereichter Beschwerdebrief an die Unternehmensleitung blieb unbeantwortet. Die CWU betont, dass es den Beschäftigten um ethische Grundsätze und nicht um finanzielle Forderungen geht. Sollte die Gewerkschaft offiziell anerkannt werden, sind Gespräche mit der Unternehmensführung oder sogar Arbeitskampfmaßnahmen möglich (Quelle: The Decoder).

Augenblick & Ewigkeit (Übung Content-Strategie)

Augenblick & Ewigkeit – Hochzeitsfotografie

Eure Kundin ist Anna Lenhoff, eine Hochzeitsfotografin, die ihr Geschäft in den letzten Jahren stark ausgebaut hat. Sie hat sich auf Hochzeitsfotografie spezialisiert und bietet Paaren eine breite Palette an Dienstleistungen an, von der Vorbesprechung über die Hochzeitsfotografie bis hin zur Nachbearbeitung und Lieferung von qualitativ hochwertigen Fotos und Fotobüchern.

Anna Lenhoff über ihre Dienstleistung

Augenblick & Ewigkeit

Herausforderungen:

Anna Lenhoff ist ständig auf der Suche nach neuen Kunden, da sie wegen der Natur ihres Angebots keine Stammkunden generieren kann. 

Sie hat auch das Gefühl, dass sie sich in einem zunehmend wettbewerbsorientierten Markt behaupten muss, in dem viele andere Fotografen ähnliche Dienstleistungen anbieten.

Da sie eine individuelle Dienstleistung erbringt, ist ihr Geschäft nur sehr begrenzt skalierbar. Sie stände Kooperationen mit anderen Fotografen aber positiv gegenüber.

Aufgaben:

  1. Formuliert konkrete Ziele, die sich aus den Herausforderungen ergeben. Entscheidet, welche davon Ihr mit einer Content-Marketing-Strategie angehen wollt. Benennt, mit welchen Messgrößen Ihr das Erreichen dieser Ziele belegen wollt.
  1. Recherchiert das Marktpotential und definiert konkret die Zielgruppe, die Ihr ansprechen wollt. Entwerft dazu eine oder mehrere Personas. Stützt euch dabei auf Daten, die Ihr aus allgemein zugänglichen Quellen ermittelt habt.
  1. Wählt ein Modell zur strategischen Planung von Content-Marketing.
  1. Entwickelt Themen entlang des gewählten Modells, mit denen Ihr die unter 1. formulierten Ziele erreichen wollt. (Arbeitstitel und kurze Beschreibung genügen). Neben Owned Content solltet Ihr auch Paid-, Earned- und Shared-Content in eure Überlegungen einbeziehen.

Möchtet Ihr mehr wissen? Dann nutzt den Chat, um von Anna weitere Informationen zu erhalten.

TikTok erweitert Barrierefreiheit: ALT-Text jetzt für Fotos

TikTok führt ALT-Text für Fotobeiträge ein und macht die Plattform damit deutlich zugänglicher für Nutzer mit Seh- und kognitiven Beeinträchtigungen. Ab sofort können Creator beim Hochladen oder nachträglich beschreibende Texte zu ihren Fotos hinzufügen. Diese werden von Screenreadern vorgelesen und ermöglichen so auch Menschen mit Einschränkungen, visuelle Inhalte besser zu erfassen.

Mit dem Schritt schließt sich TikTok anderen sozialen Netzwerken wie Instagram, Facebook und X an, die bereits ALT-Text unterstützen. Die neue Funktion ergänzt bestehende Barrierefreiheits-Tools der App, darunter automatische Untertitel für Videos und individuell anpassbare Textgrößen.

Experten bewerten das Update als wichtigen Meilenstein für Inklusion und Nutzerfreundlichkeit. Die Maßnahme dürfte nicht nur die Reichweite von Inhalten erhöhen, sondern auch das Engagement auf der Plattform steigern. TikTok setzt damit ein klares Zeichen für mehr digitale Teilhabe und könnte andere Anbieter zu ähnlichen Schritten motivieren (Quelle: TechCrunch).

ChatGPT-Texte mit unsichtbarem Wasserzeichen markiert

OpenAI versieht Texte der Modelle GPT-o3 und o4-mini mit kaum sichtbaren Unicode-Zeichen, wie der KI-Dienstleister Rumi entdeckte. Hauptsächlich wird das Zeichen „Narrow No-Break Space“ (U+202F) genutzt, das optisch einem normalen Leerzeichen ähnelt. Die Markierung soll offenbar helfen, KI-generierte Texte zu identifizieren – ohne Ankündigung durch OpenAI. Nutzer bemerken die Wasserzeichen im KI-Text nicht, sie lassen sich jedoch mit einfachen Texteditoren problemlos entfernen.

KI-Text: Wasserzeichen lassen sich leicht entfernen

Die Maßnahme befindet sich laut Rumi wohl in einer Testphase. Wird das Verfahren zu bekannt, könnte OpenAI es wieder abschalten. Ähnliche Experimente gab es zuvor bei KI-generierten Bildern und einem inzwischen eingestellten Textdetektor. Bei Konkurrenzmodellen von Google und Anthropic fanden sich keine derartigen Markierungen. Die Wirksamkeit der Wasserzeichen ist fraglich, da sie leicht entfernbar sind und nur funktionieren, solange sie unentdeckt bleiben (Quelle: Golem).

Karikatur einer Frau und eines Mannes, die gemeinsam einen Text auf einem Blatt Papier betrachten. Wasserzeichen im KI-Text lassen sich leicht entfernen.

Drahtzieher (Übung Content-Strategie)

“Drahtzieher” – Hersteller und Online-Händler hochwertiger Gitarrensaiten

Das Traditionsunternehmen Drahtzieher produziert und vertreibt hochwertige Gitarrensaiten für Konzert- und Elektrogitarren. Über einen eigenen Onlineshop und den Amazon Marketplace erzielt Drahtzieher 30 Prozent seines Absatzes im Endkundengeschäft. 60 Prozent des Absatzes entfallen auf Musikhäuser, die Drahtzieher-Saiten in ihrem Sortiment führen, die restlichen 10 Prozent gehen an Instrumentenbauer, die in Deutschland hochwertige Saiteninstrumente herstellen.

Thomas Gärtner über sein Unternehmen

Drahtzieher benötigt eine Content-Strategie

Herausforderungen:

Der Absatz in Musikhäusern mit eigenem Ladengeschäft ist seit einigen Jahren rückläufig. Gerade Verschleißartikel wie eben Gitarrensaiten bestellen viele Kunden inzwischen online. 

Die Herstellung der Saiten in Deutschland ist kostspielig und macht eine Ausweitung des Absatzes über niedrige Preise unattraktiv, zumal die deutlich bekannteren Wettbewerber, etwa Augustine oder D’Addario, ihre Saiten in China produzieren lassen.

Die Geschäftsleitung wünscht sich deshalb ein Content Marketing-Konzept, das sich gleichermaßen an Musikhäuser wie an Endkunden richtet. Neben eigenem (owned) Content soll das Content Marketing auch Strategien zu Shared Content und Earned Content entwickeln. Für den Einsatz von Paid Content steht aufgrund der aktuell schwierigen Erlössituation nur ein minimales Budget von 200 €/Monat zur Verfügung, das aktuell für Shopping-Anzeigen auf den Ergebnisseiten von Google ver(sch)wendet wird. 

Aufgaben:

1. Formuliert konkrete Ziele, die sich aus den Herausforderungen ergeben. Entscheidet, welche davon Ihr mit einer Content Marketing Strategie angehen wollt. Benennt, mit welchen Messgrößen Ihr das Erreichen dieser Ziele belegen wollt.

2. Recherchiert Marktpotential und definiert konkret die Zielgruppe, die Ihr ansprechen wollt. Entwerft dazu eine oder mehrere Personas. Stützt euch dabei auf Daten, die Ihr aus allgemein zugänglichen Quellen ermittelt habt.

3. Wählt ein Modell zur strategischen Planung von Content Marketing.

4. Entwickelt Themen entlang des gewählten Modells, mit denen Ihr die unter 1. formulierten Ziele erreichen wollt. (Arbeitstitel und kurze Beschreibung genügen).

Möchtet Ihr mehr wissen? Dann nutzt den Chat, um von Thomas weitere Informationen zu erhalten.

Bis zu 2 Minuten KI-Video pro Prompt: Amazon peppt Videogenerator Nova Reel auf

Amazon hat sein KI-Videomodell Nova Reel verbessert, wodurch es nun Videos mit einer Länge von bis zu zwei Minuten generieren kann. Das Modell Nova Reel 1.1 kann “Multi-Shot”-Videos mit einem “konsistenten Stil” über verschiedene Aufnahmen hinweg erzeugen. Benutzer können eine bis zu 4.000 Zeichen lange Eingabeaufforderung verwenden, um ein bis zu zwei Minuten langes Video zu erstellen, das aus sechssekündigen Aufnahmen besteht.

Nova Reel 1.1 führt auch einen neuen Modus namens “Multishot Manual” ein. In diesem Modus kann das Modell ein Bild zusammen mit einer Eingabeaufforderung referenzieren, um mehr Kontrolle über die Komposition einer Videoaufnahme zu bieten.

Nova Reel ist nur über AWS-Plattformen und -Dienste wie Bedrock verfügbar, und Kunden müssen einen speziellen Zugang beantragen. Wie bei den meisten generativen KI-Systemen gibt es Fragen, ob Reel mit ethisch einwandfreien Methoden entwickelt wurde. Amazon hat die Quelle der Trainingsdaten von Reel nicht bekannt gegeben und auch keine Möglichkeit für Urheber geschaffen, sich abzumelden (Quelle: TechCrunch).

NotebookLM: KI-Tool findet Quellen jetzt selbst

Googles NotebookLM erweitert seine Fähigkeiten um die automatische Quellensuche. Nutzer beschreiben ein Thema, woraufhin das KI-Tool mit Google Gemini relevante Quellen sammelt, analysiert und bis zu zehn Empfehlungen mit Zusammenfassungen liefert. Diese Quellen können dann per Klick importiert und für weitere Aufgaben genutzt werden, wie beispielsweise das Schreiben von Abhandlungen oder das Erstellen von Audio-Zusammenfassungen. Ein neues Feature namens “I’m Feeling Curious” ermöglicht es Nutzern, die automatische Quellensammlung in NotebookLM auszuprobieren. Das Feature “Discover Sources” wird aktuell für alle Nutzer ausgerollt, was bis zu einer Woche dauern kann.

Videos mit Runway: Gen-4 verspricht (fast) perfekte Konsistenz

Runway präsentiert mit Gen-4 ein bahnbrechendes KI-Modell zur Videogenerierung. Die neue Technologie verspricht, eines der größten Probleme bisheriger KI-Videotools zu lösen: die Konsistenz von Charakteren und Objekten über verschiedene Szenen hinweg.

Das in New York ansässige Startup, unterstützt von Branchengrößen wie Google, Nvidia und Salesforce, stellt Gen-4 ab sofort allen zahlenden Abonnenten und Unternehmenskunden zur Verfügung. Nutzer können damit 5 bis 10 Sekunden lange Videoclips in 720p-Auflösung erstellen.

Gen-4 ermöglicht es, mit nur einem einzigen Referenzbild konsistente Charakterdarstellungen unter verschiedenen Lichtverhältnissen zu generieren. Zudem können Nutzer Bilder von Subjekten eingeben und die gewünschte Komposition ihrer Aufnahme beschreiben.

Diese Entwicklung könnte die Filmproduktion revolutionieren. Runway hat bereits eine Partnerschaft mit dem Filmstudio Lionsgate geschlossen, um maßgeschneiderte Tools für deren Produktions- und Postproduktionsbedürfnisse zu entwickeln.

Die Veröffentlichung von Gen-4 markiert einen bedeutenden Fortschritt in der KI-gestützten Videoerstellung und könnte die Möglichkeiten für Kreative in der Medienproduktion erheblich erweitern.

Im besten Sinne museumsreif: Meilenstein der KI wird OpenSource

Das Computer History Museum und Google haben den Quellcode von AlexNet, dem bahnbrechenden neuronalen Netzwerk aus dem Jahr 2012, als Open-Source-Software freigegeben. AlexNet, entwickelt von Alex Krizhevsky, Ilya Sutskever und Geoffrey Hinton, revolutionierte die Bilderkennung und läutete die Ära des Deep Learning ein. Das convolutional neural network (CNN) konnte Objekte in Fotos mit bis dahin unerreichter Genauigkeit klassifizieren und gewann den ImageNet-Wettbewerb 2012.

Die Veröffentlichung des Python-Codes auf GitHub ermöglicht Forschern und KI-Enthusiasten einen Einblick in diesen historischen Moment der Computertechnik. AlexNet kombinierte erstmals erfolgreich tiefe neuronale Netze, große Bilddatensätze und Grafikprozessoren (GPUs) für das Training. Diese Technologie-Konvergenz legte den Grundstein für moderne KI-Systeme in Bereichen wie Gesundheitswesen, Wissenschaft und Sprachverarbeitung.

Die Entwickler von AlexNet haben seitdem unterschiedliche Wege eingeschlagen: Sutskever gründete OpenAI, Krizhevsky arbeitet an neuen Deep-Learning-Techniken, und Hinton erhielt 2024 den Nobelpreis für Physik. Die Veröffentlichung des Codes unterstreicht die historische Bedeutung von AlexNet für die KI-Forschung und -Entwicklung (Quelle: Ars Technica).