Результати пошуку для "QWEN"
Friday
2025/04/25
Monday
2025/03/10
Jingwei Hengrun: Компанія розгорнула DeepSeek і Qwen
Jingwei Hengrun використовує великі моделі, такі як DeepSeek і Qwen, для розробки професійних додатків штучного інтелекту, що охоплюють кілька областей, таких як інтелектуальна допомога, дизайн, тестування, оптимізація продукту та аналіз бізнес-процесів. Ці програми підвищують ефективність, якість роботи та знижують витрати.
- 3
- 1
Wednesday
2025/03/05
Четвертий парадигма випускає рішення для великих моделей на кшталт AIoT ModelHub для країни
Дані Jinshi 26 лютого, відомо від Четвертого парадигми, що Четверта парадигма випустила рішення для великої моделі навчання AIoT ModelHub AIoT на кінцевому пристрої, де користувачі можуть легко розгортати невеликі моделі дистиляції, такі як DeepSeek R1, Qwen 2.5, Llama 2/3, та запускати їх офлайн. Користувачі можуть гнучко перемикатися між кількома моделями, беручи до уваги компресію моделі, продуктивність розсуду, що вирішує складність розгортання та оптимізації. Компанія зазначає, що це рішення не лише задовольняє вимоги користувачів щодо конфіденційності та реального часу, але також значно знижує витрати на інференцію великої моделі штучного інтелекту.
4Paradigm запускає SageOne IA, рішення для виведення великих моделей
Четвертий парадигма представляє великий модельний рішення SageOneIA, що зменшує вартість обчислень великих моделей. Інтегрована технологія пулу обчислювальної потужності в рішенні все в одному дозволяє підтримувати кілька провідних великих моделей, підприємство може перемикатися між повноцінною версією та моделлю з випаровуванням, ефективність використання GPU збільшується на 30% або більше, а продуктивність обчислення зростає від 5 до 10 разів.
Підключення міжнародного сайту Ali до великої моделі DeepSeek
Дані Jin 12 лютого, міжнародний сайт Alibaba AI вже підключив DeepSeek та інші великі моделі і повністю застосуватиме їх в усіх ключових аспектах зовнішньої торгівлі. Після підключення штучний інтелект під час автоматичного прийому закордонних клієнтів зможе більш повно враховувати наміри покупців, а потім, сполучуючи даний інтелект з ринковими інсайтами, досвідом зовнішньої торгівлі та обставинами продуктів продавця на міжнародному сайті Alibaba, проводитиме Глибина міркування. Також відомо, що міжнародний сайт Alibaba також тестує універсальні запитання Qwen
Tuesday
2025/02/25
Алі, якщо ви можете відповісти, коли нове
QwQ-Max скоро буде випущений для широкої публіки під ліцензією Apache 2.0 Відкритий вихідний кодQwQ-Max і Qwen 2.5-Max, а менші версії, такі як QwQ-32B, доступні для розгортання на локальних пристроях. Тоді ж вийде офіційний QwQ-Max, а також вийдуть додатки для Android та iOS.
Команда Али Qwen випустила нову модель QwQ, яка покаже повний ланцюг мислення
Дані Jin 25 лютого, команда Qwen від Алібаби сьогодні вранці оголосила в соціальних мережах про випуск нової моделі мислення — Глибоке мислення (QwQ). Це модель мислення, заснована на QWQ-MAX-PREVIEW, підтримується на базі QWEN2.5-Max. Blue Whale News виявила, що подібно Глибина
- 2
- 1
Sunday
2025/02/16
Мікрософт Відкритий вихідний код інноваційний фреймворк: можна перетворити DeepSeek у AI Agent
Корпорація Майкрософт випустила останню версію OmniParser V2.0, яка підвищує ефективність і точність роботи агента ШІ на комп'ютерах, особливо у виявленні дрібних елементів інтерфейсу користувача та швидкості висновків. Продуктивність цієї версії в тесті агентів з високою роздільною здатністю також значно покращилася, досягнувши вражаючої точності 39,6%. Крім того, Microsoft має омнітул з відкритим вихідним кодом, ключовий інструмент для перетворення великих моделей на агентів.
- 2
- 4