하이퍼클로바X 멀티모달 구성 일부 활용 논란
페이지 정보
작성자 sans339 댓글 0건 조회 3회 작성일 26-01-06 09:13본문
콜백문자 무료
하이퍼클로바X 멀티모달 구성 일부 활용 논란에 "핵심 추론 엔진은 자체 개발"정부가 추진 중인 ‘독자 인공지능(AI) 파운데이션 모델’ 프로젝트를 둘러싸고 기술 자립성 논란이 다시 불거졌다. 네이버클라우드가 일부 멀티모달 구성 요소에 외부 오픈소스 모델을 활용한 사실이 알려지면서 '프롬 스크래치' 기준을 둘러싼 해석 차이가 업계 내 논쟁으로 확산되는 양상이다.5일 업계에 따르면 네이버클라우드가 멀티모달 AI 모델 '하이퍼클로바X 시드 32B 싱크'의 음성·이미지 입력을 처리하는 비전·오디오 인코더 일부에 중국 알리바바의 오픈소스 모델 '큐웬' 계열을 활용한 것으로 알려졌다.해당 인코더 가중치가 큐웬 모델과 높은 코사인 유사도와 피어슨 상관계수를 보였다는 점이 공개되면서 정부 과제 취지에 부합하는지 여부가 쟁점으로 떠올랐다.네이버클라우드가 꾸린 독자 AI 파운데이션 모델 발표회 전시 부스 (사진=한정호 기자)정부의 독자 파운데이션 모델 프로젝트는 모델을 학습 초기 단계부터 자체 기술로 구축하는 이른바 프롬 스크래치 구현을 주요 평가 요소 중 하나로 삼고 있다. 이 때문에 핵심 구성 요소 중 일부라도 외부 모델을 활용할 경우 기술 자립성에 대한 문제 제기가 불가피하다는 지적이 나온다.이에 대해 네이버클라우드는 어디까지를 파운데이션 모델로 볼 것인가에 대한 정의 차이를 제시했다. 회사 측은 "파운데이션 모델의 본질은 입력 정보를 해석하고 추론해 결과를 만들어내는 핵심 엔진에 있다"며 "이 영역은 인간으로 치면 사고와 정체성을 담당하는 두뇌에 해당한다"고 설명했다.이어 "해당 핵심 추론 엔진을 프롬 스크래치 단계부터 100% 자체 기술로 개발해 왔으며 이를 통해 한국어와 한국 사회의 복잡한 맥락을 깊이 이해하는 독자적인 경쟁력을 확보해 왔다"고 강조했다.논란이 된 비전·오디오 인코더는 이 두뇌에 입력 신호를 전달하는 역할로, 모델의 정체성과는 구분해야 한다는 입장이다.특히 비전 인코더의 경우 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하며 자체 비전 기술 역량도 충분히 보유하고 있다고 설명했다.이번 모델에서는 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다는 것이다.또 네이버클라우드는 이러한 방식이 기술 자립도가 부족해서가 아닌 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단이라고 강조했다.실제 글로벌 AI 업계에서도 알리바바의 큐웬-오디오가 오픈AI의 음성인식 기술을, 큐웬-옴니하이퍼클로바X 멀티모달 구성 일부 활용 논란에 "핵심 추론 엔진은 자체 개발"정부가 추진 중인 ‘독자 인공지능(AI) 파운데이션 모델’ 프로젝트를 둘러싸고 기술 자립성 논란이 다시 불거졌다. 네이버클라우드가 일부 멀티모달 구성 요소에 외부 오픈소스 모델을 활용한 사실이 알려지면서 '프롬 스크래치' 기준을 둘러싼 해석 차이가 업계 내 논쟁으로 확산되는 양상이다.5일 업계에 따르면 네이버클라우드가 멀티모달 AI 모델 '하이퍼클로바X 시드 32B 싱크'의 음성·이미지 입력을 처리하는 비전·오디오 인코더 일부에 중국 알리바바의 오픈소스 모델 '큐웬' 계열을 활용한 것으로 알려졌다.해당 인코더 가중치가 큐웬 모델과 높은 코사인 유사도와 피어슨 상관계수를 보였다는 점이 공개되면서 정부 과제 취지에 부합하는지 여부가 쟁점으로 떠올랐다.네이버클라우드가 꾸린 독자 AI 파운데이션 모델 발표회 전시 부스 (사진=한정호 기자)정부의 독자 파운데이션 모델 프로젝트는 모델을 학습 초기 단계부터 자체 기술로 구축하는 이른바 프롬 스크래치 구현을 주요 평가 요소 중 하나로 삼고 있다. 이 때문에 핵심 구성 요소 중 일부라도 외부 모델을 활용할 경우 기술 자립성에 대한 문제 제기가 불가피하다는 지적이 나온다.이에 대해 네이버클라우드는 어디까지를 파운데이션 모델로 볼 것인가에 대한 정의 차이를 제시했다. 회사 측은 "파운데이션 모델의 본질은 입력 정보를 해석하고 추론해 결과를 만들어내는 핵심 엔진에 있다"며 "이 영역은 인간으로 치면 사고와 정체성을 담당하는 두뇌에 해당한다"고 설명했다.이어 "해당 핵심 추론 엔진을 프롬 스크래치 단계부터 100% 자체 기술로 개발해 왔으며 이를 통해 한국어와 한국 사회의 복잡한 맥락을 깊이 이해하는 독자적인 경쟁력을 확보해 왔다"고 강조했다.논란이 된 비전·오디오 인코더는 이 두뇌에 입력 신호를 전달하는 역할로, 모델의 정체성과는 구분해야 한다는 입장이다.특히 비전 인코더의 경우 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하며 자체 비전 기술 역량도 충분히 보유하고 있다고 설명했다.
콜백문자 무료
댓글목록
등록된 댓글이 없습니다.