AI Peanuts
Posts
🕵️‍♀️ Wird GPT-5 schon heimlich getestet?

🕵️‍♀️ Wird GPT-5 schon heimlich getestet?

Robbie Bouschery
May 02, 2024

Hallo Freunde! Heute gibt’s nen KI-Schmankerl vorab: Hier ist das erste Musikvideo, das komplett mit OpenAI’s Video-KI Sora erstellt wurde. Wir finden: Gerade die “Fehler” geben dem ganzen den Vibe - ziemlich cool!

Und jetzt - rein in die Themen:

Peanuts für heute:

🕵️‍♀️ Wird GPT-5 schon heimlich getestet?
🎬️ Axel Springer und Microsoft erweitern KI-Partnerschaft
🛠️ GeoSpy.ai ist ein gruseliges Tool

🥜 Die größte Nuss:

🕵️‍♀️ Wird GPT-5 schon heimlich getestet?

Nachdem das Top-LLM von OpenAI GPT-4 jetzt schon seit über einem Jahr öffentlich ist und immer noch viele Vergleiche mit anderen LLMs dominiert, erwarten viele sehnsüchtig einen neuen Release der GPT-4 Serie.
Weil der Sprung von GPT-3’s Fähigkeiten zu GPT-4 so gewaltig war, erwarten viele, dass OpenAI wieder ähnliches gelingt. Der Erwartungsdruck für GPT-5 ist also riesig.

Und jetzt gibt es sogar Gerüchte, dass das Modell längst in aller Öffentlichkeit getestet wird. Denn: Letzte Woche tauchte auf lmsys.org (eine Website, auf der verschiedene LLMs gegeneinander evaluiert werden können) plötzlich ein neues Modell auf, das in vielen Tests extrem gut, oft besser als GPT-4 performte: gpt2-chatbot.

Weil dieses Modell eben, u.a. bei Coding Tasks bessere Ergebnisse lieferte als sowohl GPT-4, als auch Anthropic’s Modell Claude 3, gab es schnell die Vermutung, dass der Name hier nur ein Deckmantel für ein ganz neues Modell ist.

Nach dem kurzen Hype, wurde das Modell aber dann ganz schnell wieder von lmsys offline genommen. Vorher konnten Nutzer aber zumindest herausfinden, dass es viele Parallelen zu den OpenAI Modellen gibt, und, dass durchaus wahrscheinlich ist, dass das Modell auf deren Servern ausgeführt wird.

Was ist hier also los? Abschließend wird sich das wohl nicht beantworten lassen, aber zwei Theorien gelten als wahrscheinlich:

Entweder es handelt sich tatsächlich um ein neues Modell von OpenAI (ob GPT-4.5, 5, oder etwas ganz anderes ist aber nicht klar) und die Firma nutzt diesen Weg des Testings ganz bewusst, um vor dem Release Echtdaten aus der Benutzung zu sammeln und/oder um das Modell langsam zu testen, bevor es zu viel Wirbel um den wirklichen Release gibt.

Oder es handelt sich tatsächlich um ein Derivat des “alten” Modells GPT-2 (2019 veröffentlicht), das aber mit neuen Daten und mehr Rechenkapazität ausgestattet wurde. Denn: Ein kürzlich veröffentlichtes Paper fand heraus, dass die ursprüngliche GPT-2 Modell-Architektur in einigen Bereichen sogar die neusten Open Source Modelle Llama und Mistral schlägt. Diese grundsätzlichen Architektur-Vorteile wäre auch ein Erklärungsansatz für OpenAIs anhaltenden Erfolg.

Egal, was am Ende zu diesem Thema herauskommt - spannend ist, dass es gerade einige verschiedene Anbieter und Ansätze gibt, die sehr fähige LLMs hervorbringen. Wo die Grenze der Fähigkeiten von Transformer-basierten LLMs liegt, das weiß keiner so genau - aber noch scheint sie auf jeden Fall nicht erreicht zu sein.

[Mehr Infos zu gpt2-chatbot]

P.S.: Du möchtest mehr darüber lernen, was LLMs überhaupt sind und wie sie funktionieren? Dann schau dir doch unser AI Peanuts Workbook an! Darin erklären wir mit anschaulichen Beispielen die Funktionsweise von ChatGPT & co.!

🛠️ Trai it out:

GeoSpy.ai — Achtung, dieses Tool ist “gruselig”. Denn: Basierend auf einem einzigen Photo versucht dieses Tool herauszufinden, wo auf der Welt das Bild aufgenommen wurde. Dacht macht es zwar noch nicht perfekt, aber ziemlich gut. In unseren Tests lag das Tool oft nur wenige Kilometer daneben.

Wie genau das Tool es macht, ist unklar - laut eigener Aussage passiert das über eine Kombination aus KI-Sehen und LLMs.

Scheinbar hat selbst Rainbolt jetzt KI-Konkurrenz ;)

Weitere Neue Tools, Updates & Demos:

Mindtrip — Reiseplanung mit KI
Outfit.fm — Virtuell Klamotten anprobieren
BrainyDocs — Wandelt PDFs in Erklärvideos um
Braudit — Ein KI-Karriere Coach

🍭🍬 Gemischte Tüte

🇪🇺 EU-News:

Axel Springer und Microsoft haben eine Erweiterung ihrer Partnerschaft angekündigt, die sich auf Werbung, KI-gesteuerte Nutzererlebnisse und Inhalte konzentriert. Link

👩‍💻 Tech-News:

Midjourney als Web Plattform ist jetzt für alle verfügbar, die via Discord mehr als 100 Bilder erstellt haben. Link
Anthropic hat eine iOS-App mit dem KI-Chatbot Claude gestartet. Link
Scale AI hat seinen Bericht zur KI-Bereitschaft veröffentlicht. Sehr spannend. Link
Apple zielt darauf ab, Google-Mitarbeiter abzuwerben, um ein KI-Team aufzubauen. Link
Die Ukraine stellt eine KI-Sprecherin vor, um „zeitnahe Updates“ im Krieg zu liefern. Link
Interne E-Mails zeigen, dass Microsoft’s Investment in OpenAI wohl vor allem durch Angst vor Google ausgelöst wurde. Link
Apple plant, einen KI-fähigen Safari-Browser vorzustellen. Link
CoreWeave, ein Startup, das KI-Chips in Rechenzentren vermietet, sicherte sich 1,1 Milliarden Dollar bei einer Bewertung von 19 Milliarden Dollar und zählt damit zu den wertvollsten KI-Startups weltweit. Link
Microsoft wird 1,7 Milliarden Dollar in Cloud und KI in Indonesien investieren, sagt der CEO. Link
Der Umsatz von Amazon steigt, angetrieben durch künstliche Intelligenz. Link

👷 Work:

Google drängt die US-Regierung, die Einwanderungspolitik zu aktualisieren, um Talentmängel im KI-Bereich zu beheben. Link
GitHub Copilot kann jetzt beim Starten eines Projekts mit KI helfen, nicht nur beim Abschließen. Link

🆕 Neue Anwendungsfelder:

Ein New Yorker Paar sparte mindestens 10.000 $ bei der Hochzeitsplanung durch den Einsatz von KI-Technologie. ChatGPT half, Kellner zu finden und entwarf ihre „Save-the-Date“-Karten. Link

🔐 Cybersecurity:

Politiker fordern ein Verbot von „Killer-Robotern“ und die Einschränkung von KI-Waffen. Link

🏥 Health:

Google hat gerade Med-Gemini eingeführt, eine Suite von auf Gesundheitsfragen spezialisierten KI-Modellen. Link

🖼️ Kreativindustrie:

Große US-Zeitungen verklagen OpenAI und Microsoft wegen Urheberrechtsverletzungen. Link

🧂 Salty Memes:

felt cute, might buy 350k GPUs later
— sophie (@netcapgirl)
Apr 30, 2024

Wir wollen uns verbessern! Wie hat dir diese Ausgabe gefallen? Welche Themen wünschst du dir für die Zukunft mehr?

Bis Dienstag!