Модель BELLE-7B-1M представляет собой расширенную версию ИИ для работы с текстовыми инструкциями. Использование 1 миллиона примеров данных позволило значительно повысить качество генерации и точность ответов нейросети в сравнении с младшими версиями.
"BELLE is based on Bloomz-7b1-mt and finetuned with 0.2M Chinese data combined with 50,000 pieces of English data from the open source Stanford-Alpaca, resulting in good Chinese instruction understanding and response generation capabilities. The code of Chinese data generation and other detailed information can be found in our Github project repository: https://github.com/LianjiaTech/BELLE. We trained models using datasets of different sizes (200,000, 600,000, and 1,000,000 samples) for instruction learning, and we obtained different model versions as shown below:"