BELLE-7B-0.2M — это специализированная языковая модель на базе Bloomz, оптимизированная для точного следования инструкциям. Благодаря дообучению на комбинированном датасете, этот ИИ отлично справляется с генерацией текста и пониманием сложных запросов.
BELLE is based on Bloomz-7b1-mt and finetuned with 0.2M Chinese data combined with 50,000 pieces of English data from the open source Stanford-Alpaca, resulting in good Chinese instruction understanding and response generation capabilities. The code of Chinese data generation and other detailed information can be found in our Github project repository: https://github.com/LianjiaTech/BELLE. We trained models using datasets of different sizes (200,000, 600,000, and 1,000,000 samples) for instruction learning, and we obtained different model versions as shown below: