Architektura: Mistral Large 2 používá architekturu dekodéru Transformer. Využívá “hustou” neuronovou síť, kde je každá část sítě propojena.
Parametry: Má 123 miliard parametrů, což mu umožňuje zpracovávat složité jazykové úkoly s vysokou přesností. Tato velikost umožňuje modelu zpracovávat složité jazykové úkoly s velkou jemností. Mistral AI navrhla velikost modelu tak, aby mohl fungovat ve velkém rozsahu na jednom uzlu.
Kontextové okno: Má kontextové okno s 128 tisíci tokeny, které pomáhá udržovat koherenci a relevanci v dlouhých konverzacích nebo dokumentech.
Vícejazyčná podpora: Mistral Large 2 podporuje mnoho jazyků, včetně ruštiny, čínštiny, japonštiny, korejštiny, španělštiny a italštiny.
Programovací jazyky: Vyniká ve více než 80 programovacích jazycích, jako jsou Python, Java, C, C++ a JavaScript.
Výkon: Mistral Large 2 vykazuje silný výkon v různých testech a konkuruje modelům jako GPT-4o od OpenAI a Llama 3 405B od Meta. Dobře si vede ve Wild Bench, kde se umístil na druhém místě hned za GPT-4o. Na Arena Hard se umístil na třetím místě, za GPT-4o a Claude 3.5 Sonnet.
Volání funkcí: Mistral Large 2 překonává větší modely, jako jsou GPT-4o a Claude 3.5 Sonnet, ve volání funkcí.
Efektivita: Mistral Large 2 stanovuje nový standard v poměru výkon/cena, nabízí skvělý výkon za dostupnou cenu.
Redukce halucinací: Mistral AI se zaměřila na minimalizaci nepřesností přidáním přísnějších kontrol přesnosti a systémů zpětné vazby, aby zajistila, že model poskytuje spolehlivé informace. Mistral tvrdí, že Large 2 produkuje stručnější odpovědi než přední modely umělé inteligence.
Licencování: Mistral Large 2 je k dispozici pod licencí Mistral Research License pro open-source použití a úpravy pro výzkumné a nekomerční účely. Pro komerční použití je vyžadována komerční licence Mistral.