IBM, Granite 3.0 LLM으로 기업 AI 혁신을 예고하다!


News Image
IBM은 최근 기업 AI 능력을 향상시키기 위해 Granite 3.0 대형 언어 모델(Large Language Models, LLMs) 가족을 소개했습니다. 발표의 주요 내용을 정리했습니다:

모델 변형
Granite 3.0 가족에는 Granite 3.0 8B와 2B 언어 모델과 같이 여러 모델이 포함되어 있습니다. 이 모델들은 일반 용도/언어 모델, 안전성 모델(Granite Guardian), 혼합 전문가 모델(Mixture-of-Experts, MoE)로 분류됩니다. 이들은 지침 기반 버전과 기본 버전 모두에서 제공됩니다.

성능 및 효율성
이 모델들은 검색 기반 생성(Retrieval Augmented Generation, RAG), 분류, 요약, 개체 추출, 도구 사용 등 다양한 작업에서 강력한 성능을 발휘하도록 최적화되었습니다. 기업 데이터를 바탕으로 세밀하게 조정할 수 있어 다양한 비즈니스 환경에서 다재다능하고 효율적입니다.

훈련 및 데이터
Granite 3.0 모델은 12개 자연어와 116개 프로그래밍 언어의 12조 개 이상의 토큰으로 훈련되었습니다. 훈련 과정에서는 새로운 두 단계 방법과 수천 가지 실험을 통해 데이터 품질과 훈련 매개변수를 최적화했습니다.

오픈 소스 및 라이선스
IBM의 오픈 소스 AI에 대한 약속에 따라 Granite 3.0 모델은 Apache 2.0 라이선스 하에 공개되었습니다. 이는 광범위하고 제한 없는 상업적 사용과 커뮤니티 주도의 개발을 가능하게 합니다.

안전성 및 투명성
IBM은 이 모델에서 투명성과 안전성을 강조합니다. 기술 보고서와 책임 있는 사용 가이드는 사용된 데이터 세트, 필터링 및 정제 단계, 주요 벤치마크에 대한 포괄적인 성능 결과에 대한 자세한 정보를 제공합니다. 또한 IBM은 모든 Granite 모델에 대한 지식 재산권 면책을 제공하여 기업 고객 간의 신뢰를 구축합니다.

배포 및 통합
이 모델은 다양한 비즈니스 워크플로에 원활하게 통합되도록 설계되었으며, IBM Consulting Advantage의 기본 모델이 될 것으로 예상됩니다. 이러한 통합은 IBM 고객이 생성 AI 프로젝트에서 투자 수익을 극대화하는 데 도움을 줄 것입니다.

비용 효율성
작은 Granite 모델과 기업 데이터를 결합함으로써 기업은 더 큰 모델과 비슷한 작업 성능을 얻을 수 있으며, 비용은 특정 개념 증명에서 3배에서 23배까지 적은 것으로 추정됩니다.

전반적으로 Granite 3.0 모델은 성능, 효율성 및 투명성의 균형을 제공하며, 비즈니스 환경에서 혁신과 채택을 이끌 주요 발전을 나타냅니다.