тенгрИИ — туралыо проектеabout
Жаңа буын қазақ LLM. Тілді бірінші санаймыз: ережелер, нюанс, мәдениет, контекст. Казахская LLM нового поколения. Язык — первичен: правила, нюансы, культура, контекст. A new-generation Kazakh LLM. Language first: rules, nuance, culture, context.
01МиссияМиссияMission
Қазақ тілі — біздің ой жүйеміз. Бірақ дүние жүзіндегі үлкен тіл модельдері оны екінші санатта ұстайды: аудармадан кейін, контекстсіз, мәдениетсіз. Казахский язык — это система нашего мышления. Но крупные мировые языковые модели держат его во втором эшелоне: после перевода, без контекста, без культуры. The Kazakh language is the system in which we think. Yet the world's large language models keep it in a second tier — translated, context-stripped, culture-flat.
тенгрИИ — қазақ тілін бастапқы деп санайтын жасанды интеллект. Сөздің астарын, мәдениет белгілерін, аймақтық нюанстарды түсінеді. Сонымен қатар орыс және ағылшын тілдерінде де еркін. тенгрИИ — искусственный интеллект, для которого казахский язык первичен. Понимает подтекст, культурные коды, региональные нюансы. И при этом свободно владеет русским и английским. tengrAI is an AI that treats Kazakh as a first-class language. It reads subtext, cultural cues and regional nuance — and is equally fluent in Russian and English.
Мақсат қарапайым: қазақша сөйлейтін адам ағылшын тілді әріптесімен бірдей құралға ие болуы керек. Цель проста: казахоязычный человек должен иметь тот же инструмент, что и его англоязычный коллега. The goal is simple: a Kazakh-speaking person should have the same tool as their English-speaking peer.
02МүмкіндіктерВозможностиCapabilities
Қазақша негізіндеКазахский — основаKazakh-first
Жалғаулар, септіктер, диалектілер мен сөйлеу мәнері — табиғи. Аударма арқылы емес, тікелей. Аффиксы, падежи, диалекты и стиль речи — естественны. Не через перевод, а напрямую. Affixes, cases, dialects and speech style — native. Not via translation, but directly.
Үш тілді еркінСвободно на трёх языкахFluent in three
KK · RU · EN. Сұраққа қай тілде жауап беру керектігін өзі шешеді. KK · RU · EN. Сам решает, на каком языке отвечать на вопрос. KK · RU · EN. It chooses the right reply language on its own.
Мәдениет пен контекстКультура и контекстCulture and context
Тарихи аттар, тұрмыстық сөздер, әдеп нормалары — тек грамматика емес, мағына. Исторические имена, бытовые слова, нормы этикета — не только грамматика, но смысл. Historical names, everyday words, etiquette — not just grammar, but meaning.
Әңгімелесу режиміРазговорный режимConversational mode
Дос сияқты сөйлейді: қысқа, тірі, шынайы. Бюрократтық тіл жоқ. Говорит как друг: коротко, живо, искренне. Без канцелярита. Speaks like a friend: short, alive, honest. No bureaucratic tone.
Көмекші құралВспомогательный инструментA working tool
Жазу, түсіндіру, аудару, сұрақтарға жауап беру, оқуға дайындық. Писать, объяснять, переводить, отвечать на вопросы, готовиться к учёбе. Writing, explaining, translating, answering, study prep.
Жеке құрылғыда жүру әлеуетіРабота на устройствеOn-device potential
Модель ықшам, телефон/ноутбукта жүруге дайындалады. Деректер — сізде қалады. Модель компактна, готовится к запуску на телефоне/ноутбуке. Данные остаются у вас. Compact model, being prepared to run on phone/laptop. Your data stays with you.
03Қалай жұмыс істейдіКак устроеноHow it works
АрхитектураАрхитектураArchitecture
- 7 миллиард параметр — заманауи орта ауқымдағы тіл моделі. 7 миллиардов параметров — современная модель среднего масштаба. 7 billion parameters — a modern mid-scale language model.
- Ашық негіздегі трансформер (Apache 2.0) + қазақ тіліне арнайы файнтюн. Открытый базовый трансформер (Apache 2.0) + специальный файнтюн под казахский язык. An open-source transformer base (Apache 2.0) plus a dedicated Kazakh fine-tune.
- Көп кезеңді оқыту: тіл корпусы → нұсқаулықтарға жауап → адам пайымы (RLHF). Многоэтапное обучение: языковой корпус → инструкции → обратная связь от людей (RLHF). Multi-stage training: language corpus → instruction tuning → human feedback (RLHF).
ДеректерДанныеData
- Ашық қазақ тілі көздері: Wikipedia, академиялық ресурстар, ашық лицензиямен берілген корпустар. Открытые источники на казахском: Wikipedia, академические ресурсы, корпусы под открытыми лицензиями. Open Kazakh sources: Wikipedia, academic resources, openly-licensed corpora.
- Заңды құқықтары мұқият тексерілген материалдар ғана. Только материалы с тщательно проверенными правами. Only materials with carefully verified rights.
- Жеке хат-хабар, жеке деректер қолданылмайды. Личная переписка и персональные данные не используются. Private correspondence and personal data are not used.
СапаКачествоQuality
- Әр шығарылым алдында ауызекі қазақша, нұсқаулыққа жауап, фактологиялық сұрақтар бойынша сынақтан өтеді. Перед каждым выпуском — тесты на разговорный казахский, инструкции и фактологию. Every release passes conversational-Kazakh, instruction-following and factual tests.
- Қолданушы кері байланысы (👍/👎) келесі итерацияға енгізіледі. Обратная связь пользователей (👍/👎) идёт в следующую итерацию. User feedback (👍/👎) feeds into the next iteration.
04Жол картасыДорожная картаRoadmap
Іргетас. Қазақ тілі корпусы, базалық файнтюн, ішкі сынақтар. Фундамент. Казахский корпус, базовый файнтюн, внутренние тесты. Foundation. Kazakh corpus, base fine-tune, internal testing.
Нұсқаулық режимі, диалог стилі, identity, мәдени қабат. Режим инструкций, стиль диалога, identity, культурный слой. Instruction mode, dialogue style, identity, cultural layer.
Жабық сынақ. Cайт, чат, жеке тұлғалық сүзгі. Закрытое тестирование. Сайт, чат, фильтр персональности. Closed testing. Site, chat, persona filter.
Көпшілікке ашық шығарылым. Публичный релиз. Public release.
iOS / Android · құрылғы ішінде жұмыс істейтін жеңілдетілген нұсқа. iOS / Android · облегчённая версия, работающая прямо на устройстве. iOS / Android · a lightweight on-device build.
Әзірлеушілерге арналған қызмет. Сервис для разработчиков. Service for developers.
05ҚұпиялылықПриватностьPrivacy
Қарапайым ережелер:Простые правила:Simple rules:
- Сұхбатыңызды браузеріңізде ғана сақтаймыз. Серверде ұзақ сақтамаймыз. Историю чата храним только в вашем браузере. На сервере не держим долго. We store your chat only in your browser. Nothing kept long-term on the server.
- Жауап сапасына қойған 👍/👎 белгілеріңіз ғана анонимді түрде келесі оқытуға қолданылады. Только ваши 👍/👎 на ответы анонимно идут в следующую итерацию обучения. Only your 👍/👎 ratings on replies go anonymously into the next training round.
- Жеке тұлғалық деректерді сұрамаймыз және сақтамаймыз. Личные данные не запрашиваем и не храним. We don't ask for or store personal data.
- Үшінші тұлғаларға сатпаймыз. Третьим лицам не продаём. We don't sell to third parties.
Толық саясат v1.0 шығарылымына дейін жарияланады. Сұрақтар — privacy@tengrai.ai. Полная политика будет опубликована до релиза v1.0. Вопросы — privacy@tengrai.ai. The full policy will be published before the v1.0 release. Questions — privacy@tengrai.ai.
06Лицензиялар мен атрибуцияЛицензии и атрибуцияLicenses and attribution
Біз ашық қауымдастықтың үлесін мойындаймыз. Мы признаём вклад открытого сообщества. We acknowledge the open-source community's contribution.
- Базалық трансформер:
Apache License 2.0Базовый трансформер:Apache License 2.0Base transformer:Apache License 2.0 - Қазақ тілі корпустары:
CC BY 4.0және басқа да ашық лицензиялар Казахские корпусы:CC BY 4.0и другие открытые лицензии Kazakh corpora:CC BY 4.0and other open licenses - Дауыс синтезі (TTS) компоненттері:
MIT·CC BY 4.0·MPLКомпоненты синтеза речи (TTS):MIT·CC BY 4.0·MPLSpeech-synthesis (TTS) components:MIT·CC BY 4.0·MPL
Толық NOTICE/LICENSE файлы v1.0 шығарылымымен бірге репозиторийде ашылады. Полный файл NOTICE/LICENSE откроется в репозитории вместе с релизом v1.0. The full NOTICE/LICENSE file will be published with the v1.0 release.
07ТопКомандаTeam
Жобаны жасайтындар. Те, кто делает проект. The people building this.
Роман Поляков
Әзірлеуші · негізін салушы Разработчик · основатель Developer · founder
roman@tengrai.ai08БайланысКонтактыContact
- Жалпы:Общие:General: hello@tengrai.ai
- Құпиялылық:Приватность:Privacy: privacy@tengrai.ai
- Заңды:Юридические:Legal: legal@tengrai.ai
- Журналистерге:Прессе:Press: press@tengrai.ai
© 2026 тенгрИИ. Қазақстанда жасалған. © 2026 тенгрИИ. Сделано в Казахстане. © 2026 tengrAI. Made in Kazakhstan.