Circa un anno fa, sono emerse indiscrezioni sul fatto che Amazon stesse sviluppando il suo primo Large Language Model (LLM) di punta, nome in codice Olympus. Sembra che il suo debutto sia imminente: la prossima settimana, alla conferenza AWS re:Invent, fonti interne hanno rivelato che Olympus avrà tutte le capacità multimodali degli LLM di Google, OpenAI e Microsoft, ovvero sarà in grado di elaborare e comprendere testo e immagini, ma con una differenza.
Olympus sarà presumibilmente in grado di trovare momenti visivi specifici in video o immagini, tramite semplici prompt di testo. Ad esempio, se si stesse guardando una partita di basket e si chiedesse a Olympus di “trovare il canestro vincente”, esso cercherebbe nel filmato e mostrerebbe il canestro che ha vinto la partita.
Questo non solo permetterà ad Amazon di entrare finalmente nella corsa agli LLM, ma ridurrà anche la sua dipendenza da LLM di terze parti, come quelli di Anthropic, in cui ha appena investito 8 miliardi di dollari. Fonte: AiToolReport.