Microsoft, Phi-4 모델 완전 오픈 소스로 공개! 인공지능 혁명의 새로운 물결이 시작된다!


News Image
마이크로소프트가 최근 Phi-4 모델을 출시하였으며, 이는 인공지능 분야에서 중요한 발전을 의미합니다. 특히 작지만 뛰어난 언어 모델 개발에 기여하고 있습니다. 아래는 기사의 주요 내용입니다.

모델 개요
마이크로소프트의 Phi-4는 140억 개의 파라미터를 가진 소형 언어 모델로, 복잡한 추론, 수학 문제 해결 및 코딩 작업에 뛰어나도록 설계되었습니다. 상대적으로 작은 크기임에도 불구하고 Phi-4는 Qwen 2.5와 같은 더 큰 모델보다 더 나은 성능을 보이며, Llama 3.3 및 GPT-4O와 같은 모델과도 여러 벤치마크에서 경쟁하고 있습니다.

성능
Phi-4는 여러 벤치마크에서 뛰어난 성능을 보여주었습니다:
- 2024년 11월 AMC 10/12 수학 시험에서 평균 점수 91.8을 기록하며 다른 모델을 초월했습니다.
- MATH 벤치마크에서 80.4, GPQA(대학원 수준 STEM Q&A)에서 56.1, HumanEval(코딩 작업)에서 82.6을 기록했습니다.

훈련 및 데이터
이 모델은 합성 데이터 세트, 필터링된 공개 도메인 웹사이트 데이터, 획득한 학술서 및 Q&A 데이터 세트를 혼합하여 훈련되었습니다. 이러한 접근 방식은 고도의 추론에 초점을 맞춘 양질의 데이터를 보장하였습니다. 훈련 과정에는 지도학습 미세 조정과 지침 준수를 향상하기 위한 직접적인 선호 최적화가 포함되었습니다.

사용 가능성 및 접근성
Phi-4는 Azure AI Foundry에서 사용할 수 있으며, Hugging Face에서도 제공되어 개발자와 연구자들이 모델을 쉽게 다운로드하고 로컬에서 실행할 수 있습니다. 16GB VRAM를 가진 시스템이나 24GB RAM이 장착된 Mac에서도 실행할 수 있어, 다양한 사용자들이 접근할 수 있도록 하고 있습니다.

안전성 및 평가
출시 전에 Phi-4는 여러 오픈소스 안전 벤치마크와 내부 도구를 사용하여 철저한 안전 평가를 받았습니다. 이 과정에는 적대적 대화 시뮬레이션과 마이크로소프트의 독립 AI 레드팀(AIRT)의 평가가 포함되어 잠재적인 안전 위험을 식별하고 완화하였습니다.

미래 응용
모델의 효율성과 고급 추론 능력은 교육, 연구 및 기업 AI 분야에서 응용하기에 매력적인 선택이 됩니다. Phi-4의 성공은 전통적으로 더 큰 시스템이 지배하던 분야에서 소형 언어 모델의 잠재력이 커지고 있음을 보여줍니다.

마이크로소프트는 Phi-4를 Hugging Face에서 완전 오픈 소스로 제공함으로써 전 세계의 개발자와 연구자들을 지원하고, 다음 세대의 지능적이고 효율적인 AI 모델 개발을 위한 길을 열고자 하고 있습니다.