Модель туралы карточкасы Карточка модели Model card
Жаңартылған: 2026-05-29 Обновлено: 2026-05-29 Last updated: 2026-05-29
Жалпы сипаттамаОписаниеOverview
| АтауНазваниеName | тенгрИИ / tengrAI |
|---|---|
| Базалық модельБазовая модельBase model | Qwen2.5-7B (Apache 2.0) |
| ТілЯзыкиLanguages | Қазақша · Русский · English |
| ПараметрлерПараметрыParameters | 7B |
| КонтекстКонтекстContext | 32k tokens |
| Файнтюн әдісіМетод файнтюнаFine-tune method | SFT + DPO, LoRA / full |
| КвантизацияКвантизацияQuantization | Q5_K_M (server) · Q4_K_M (mobile fallback) |
| ЛицензияЛицензияLicense | Apache 2.0 (base) · proprietary fine-tune |
ТағайындалуыНазначениеIntended use
- Қазақ тіліндегі сұхбат, аударма, мәтін қорытындысы.Диалог, перевод, суммаризация на казахском.Kazakh-language chat, translation, summarization.
- Білім беру, тіл үйрену.Образование, изучение языка.Education, language learning.
- Жалпы көмекші: жоспарлау, жазу, идея.Общий ассистент: планирование, письмо, идеи.General assistant: planning, writing, ideation.
Қолданылмайтын саналарНе для этих задачOut-of-scope
- Медициналық, заңды, қаржылық, психологиялық кеңес.Медицинские, юридические, финансовые, психологические консультации.Medical, legal, financial or psychological advice.
- Шынайы уақыттағы мәліметтер (модель кесінді — 2026 басы).Информация в реальном времени (cutoff модели — начало 2026).Real-time information (model cutoff — early 2026).
- Маңызды шешімдер үшін бір ғана дереккөз ретінде.Единственным источником для важных решений.As the sole source for important decisions.
ШектеулерОграниченияLimitations
- Галлюцинациялар: атаулар, күндер, статистика — қателесуі мүмкін.Галлюцинации: имена, даты, статистика — могут быть неверны.Hallucinations: names, dates, statistics may be wrong.
- Диалектілер: оңтүстік/батыс нюанстар әлсіз.Диалекты: южные/западные нюансы — слабее.Dialects: southern/western nuances are weaker.
- STEM (математика, физика): шектеулі дәлдік.STEM (математика, физика): ограниченная точность.STEM (math, physics): limited accuracy.
- Бағдарламалау: жалпы Python/JS көмек, ірі архитектураға қарап шешім қабылдауға жарамайды.Программирование: базовая помощь Python/JS, не для крупной архитектуры.Coding: basic Python/JS help, not for large architecture decisions.
Қауіпсіздік қабатыSafety layerSafety layer
Жүйелік prompt + reject patterns + контент-фильтр. Балалар эксплуатациясы, террор, зорлық нұсқаулары — бұғатталады. Jailbreak әрекеттері тіркеледі. System prompt + reject patterns + content filter. Эксплуатация детей, терроризм, инструкции к насилию — блокируются. Попытки jailbreak логируются. System prompt + reject patterns + content filter. Child exploitation, terrorism, violence instructions — blocked. Jailbreak attempts are logged.
БағалауОценка качестваEvaluation
v1.0 шығарылымына дейін публикалық бенчмарктер жоспарланбаған (стелс-саясат). Ішкі smoke-тест: 100+ KK/RU/EN сценарийі — v0.95-те ≥97% PASS. v1.0-та толық карточка бенчмарктермен жариаланады. До релиза v1.0 публичные бенчмарки не запланированы (stealth-политика). Внутренний smoke-тест: 100+ сценариев KK/RU/EN — на v0.95 ≥97% PASS. На v1.0 будет опубликована полная карточка с бенчмарками. No public benchmarks planned before v1.0 release (stealth policy). Internal smoke test: 100+ KK/RU/EN scenarios — ≥97% PASS at v0.95. Full benchmark card to be published at v1.0.
Тренинг деректеріДанные обученияTraining data
Толық тізім — /license: Wikipedia (KK), Common Crawl C4 (kk), HPLT v2, KSC2, KazakhTTS, adilet.zan.kz, syntetic Q&A. Полный список — /license: Wikipedia (KK), Common Crawl C4 (kk), HPLT v2, KSC2, KazakhTTS, adilet.zan.kz, синтетические Q&A. Full list at /license: Wikipedia (KK), Common Crawl C4 (kk), HPLT v2, KSC2, KazakhTTS, adilet.zan.kz, synthetic Q&A.
Ескерту: бұл модель жалпы көмекші ретінде жасалған. Маңызды шешімдерді тек ИИ жауабына сүйеніп қабылдамаңыз. Предупреждение: модель — общий ассистент. Не принимайте важных решений, опираясь только на ответ ИИ. Warning: this model is a general assistant. Do not make critical decisions based solely on AI replies.