Spoločnosť OpenAI uvoľnila dvojicu nových jazykových modelov, ktoré vynikajú v logickom uvažovaní a sú navrhnuté tak, aby fungovali aj na bežných notebookoch. Sú to takzvané open-weight modely, ktorých parametre sú verejne dostupné, čo umožňuje vývojárom ich ďalej upravovať pre špecifické úlohy bez potreby pôvodných trénovacích dát. Oznámila to spoločnosť OpenAI.
Na rozdiel od plne otvorených takzvaných open-source modelov, ktoré zverejňujú aj zdrojový kód a trénovacie dáta, tieto open-weight modely sprístupňujú iba akýsi "výsledok učenia", teda iba finálne parametre modelu. Vývojári ich ale môžu ďalej upravovať a používať aj bez prístupu k pôvodným dátam. Výhodou je, že si ich firmy môžu spustiť na vlastnej infraštruktúre a nemusia ich prevádzkovať cez internet.
Amazon zároveň oznámil, že nové modely OpenAI sú po prvýkrát dostupné aj na jeho platforme Bedrock v rámci cloudovej služby Amazon Web Services. To umožní ich využitie ďalším firmám, ktoré pracujú s generatívnou umelou inteligenciou.
Tento rok panuje pri otvorených modeloch silná konkurencia. Donedávna dominovali tejto oblasti modely Llama od firmy Meta, ale ich pozíciu narušil čínsky DeepSeek, ktorý predstavil výkonný a zároveň lacný model zameraný na logické úlohy. Meta má navyše stále problémy s novou verziou Llama 4.
Pre OpenAI ide o prvé otvorené modely od roku 2019, kedy uviedla GPT-2. Väčší z nových modelov, gpt-oss-120b, zvládne bežať na jednom grafickom čipe (GPU), menší gpt-oss-20b dokonca aj na bežnom osobnom počítači. Podľa firmy sa oba modely výkonom blížia jej menším uzavretým modelom a dobre si vedú najmä v programovaní, matematických úlohách a otázkach z oblasti zdravotníctva. Boli trénované na textových dátach so zameraním na vedu, matematiku a kódovanie.
OpenAI nezverejnila priame porovnanie s konkurenciou. Firma, ktorej hlavným investorom je Microsoft, sa aktuálne usiluje o nové financovanie vo výške až 40 miliárd dolárov. Hodnota spoločnosť teraz činí 300 miliárd USD, napísala agentúra Reuters.