
Prispevek na spletnem portalu OpenAI napoveduje izid modela GPT-5.4, ki predstavlja OpenAI-jev najnaprednejši sistem za profesionalno delo in kompleksne operativne naloge. Nova tehnologija združuje izboljšano logično sklepanje z izjemnimi sposobnostmi upravljanja računalniških okolij in neposredno uporabo programskih orodij. Uporabnikom omogoča sprotno usmerjanje procesa razmišljanja ter učinkovito delo z obsežnimi dokumenti, tabelami in programsko kodo. Poleg standardne različice je na voljo tudi GPT-5.4 Pro, ki je namenjen najzahtevnejšim nalogam v poslovnih in razvojnih okoljih. Model prinaša večjo natančnost, hitrejše delovanje in znatno zmanjšanje števila napak pri zahtevnem spletnem raziskovanju. Celoten sistem je zasnovan z močnim poudarkom na varnosti in nadzorovanem razmišljanju umetne inteligence.
V tem prispevku je OpenAI napovedal izid modela GPT‑5.4, ki je na voljo v ChatGPT (kot GPT‑5.4 Thinking), vmesniku API in okolju Codex. Ta model združuje vrhunske sposobnosti programiranja modela GPT‑5.3‑Codex z naprednim sklepanjem in agentnimi delovnimi tokovi.
V nadaljevanju podajamo povzetek spletnega prispevka.
Ključne zmogljivosti in funkcije
- Splošno upravljanje računalnika: Prvi model za splošno uporabo, ki lahko neposredno upravlja računalnik, uporablja ukaze za miško in tipkovnico ter navigira po programskih okoljih prek knjižnic, kot je Playwright.
- Razširjen kontekst: Podpira do 1 milijon žetonov (tokens) v okoljih Codex in API, kar omogoča dolgoročno načrtovanje in preverjanje nalog.
- GPT-5.4 Thinking: V ChatGPT model zdaj pripravi vnaprejšnji načrt razmišljanja, omogoča popravke smeri sredi generiranja odgovora in vključuje izboljšano poglobljeno spletno raziskovanje.
- Vizualno zaznavanje: Izboljšana obdelava slik visoke ločljivosti (do 10,24 milijona slikovnih pik) in vrhunsko razpoznavanje kompleksnih dokumentov (OmniDocBench).
Primerjalni testi zmogljivosti
GPT‑5.4 kaže znatne izboljšave v primerjavi z GPT‑5.2 na več strokovnih in tehničnih področjih:
- GDPval: Dosega 83,0 % uspeh, s čimer se kosa s strokovnjaki ali jih celo presega v 44 različnih poklicih.
- Upravljanje računalnika (OSWorld): Dosega 75,0 % uspeh, kar presega človeško povprečje (72,4 %).
- Modeliranje preglednic: Dosegel 87,3 % v primerjavi z 68,4 % pri predhodniku.
- Abstraktno sklepanje (ARC-AGI-2): Skok na 73,3 % uspešnost.
- Faktografska točnost: 33 % manj napačnih posameznih trditev in 18 % manj napak v celotnih odgovorih.
Učinkovitost in integracija orodij
- Iskanje orodij (Tool Search): Namesto nalaganja vseh definicij orodij v poziv model samodejno poišče potrebna orodja, kar zmanjša porabo žetonov za 47 % pri kompleksnih nalogah.
- Učinkovitost žetonov: GPT‑5.4 je najučinkovitejši model za sklepanje doslej, saj za reševanje težav porabi bistveno manj žetonov kot GPT‑5.2.
- Hitrost v Codexu: Način /fast omogoča do 1,5-krat hitrejše generiranje kode.
Varnost in uvajanje
- Kibernetska varnost: Model je opredeljen kot sistem z “visoko kibernetsko zmogljivostjo” in vključuje razširjen nadzor ter asinhrono blokiranje visokotveganih zahtev.
- Nadzor razmišljanja (CoT): Testi kažejo, da model ne zmore namerno prikriti svojega procesa razmišljanja, kar je ključno za zagotavljanje varnostnega nadzora.
- Razpoložljivost: Model se že uvaja za uporabnike Plus, Team in Pro. GPT-5.2 Thinking bo dokončno upokojen 5. junija 2026.
Primerjava cen API (na 1 milijon žetonov)
| Model | Cena vnosa (Input) | Cena izhoda (Output) |
| gpt-5.4 | 2,50 $ | 15,00$ |
| gpt-5.4-pro | 30,00 $ | 180,00$ |