GitHub integriert OpenAIs neuestes Modell o3-mini in Copilot und GitHub Models. Das Reasoning-Modell übertrifft den Vorgänger o1 teils bei Coding-Benchmarks und bietet eine ähnlich schnelle ...
Automatisiert der ChatGPT-Operator endlich die Browserbenutzung? Erste Tests von Nutzer:innen machen Hoffnung darauf, mit natürlicher Sprache durchs Web zu navigieren, zeigen jedoch auch die kaum ...
In den Benchmark-Tests erzielte Tülu 3 405B laut AI2 bessere Ergebnisse als frühere Open-Source-Modelle wie Llama 3.1 405B Instruct und Nous Hermes 3 405B. Die Forscher betonen, dass das Training ...
OpenAI veröffentlicht sein neuestes Reasoning-Modell o3-mini, das besonders bei naturwissenschaftlichen Aufgaben überzeugen soll und auch ChatGPT-Nutzern der freien Version zur Verfügung steht. Das ...
YuE ist eine Open-Source-Alternative zu Diensten wie Suno oder Udio. Laut dem beteiligten Entwickler Ruibin Yuan funktioniert es in mehreren Sprachen und Musikstilen und kann bis zu fünf Minuten Audio ...
Das System akzeptiert zwischen 1 und 20 Trainingsbilder in gängigen Formaten wie JPG, PNG und WebP. Die Auflösung der Trainingsbilder wird bei einem Megapixel gekappt. Für optimale Ergebnisse ...
Für die kommenden Monate kündigt Google die Integration von Project Astra an, das Screensharing und Live-Video-Streaming ermöglichen soll. Diese Funktionen werden zuerst in der Gemini-App für Android ...
OpenAI hat sein Sprachmodell GPT-4o in ChatGPT aktualisiert. Das Update erweitert den Trainingsdatensatz bis Juni 2024, was zu aktuelleren und kontextbezogeneren Antworten führen soll. Zudem wurde die ...
Laut Newsguard wiederholte Deepseek in 30 Prozent der Fälle falsche Behauptungen und wich in 53 Prozent der Fälle den Fragen aus. Insgesamt versagte das LLM also in 83 Prozent der getesteten Fälle. Im ...
Besonders gut schneidet es bei Aufgaben mit sehr langen Kontexten ab: Beim "Needle-In-A-Haystack"-Test mit 4 Millionen Token, bei dem das Sprachmodell bestimmte Informationen aus einer riesigen ...
Der neue Assistent kann etwa Tischreservierungen vornehmen, Uber-Fahrten buchen, YouTube-Videos finden oder Erinnerungen setzen. Dabei behält er den Kontext des Gesprächs bei: Wer beispielsweise auf ...
Ein Tool namens Parlex kann eine "parlamentarische Stimmungsprüfung" durchführen und prognostizieren, welche Themen bei den eigenen Hinterbänklern auf Schwierigkeiten stoßen könnten. Es ist Teil einer ...