비네쉬 수크마 퀄컴 테크날러지
페이지 정보
작성자 sans339 댓글 0건 조회 3회 작성일 25-09-26 09:39본문
인천개인회생
비네쉬 수크마 퀄컴 테크날러지 제품 관리 부사장 [사진=공동취재단][디지털데일리 김문기 기자] “AI는 지금 속도의 시대(Speed is the mode)에 들어섰다. AI 성능이 더 이상 순간적인 시연에 머물지 않고, 사용자 일상 속에서 끊김 없는 경험으로 이어져야 한다."24일(현지시간) 퀄컴은 미국 마우이 라히아나 하얏트 리젠시 호텔에서 개최된 퀄컴 스냅드래곤 서밋 2025 무대에서 차세대 모바일 AI 플랫폼 ‘스냅드래곤 8 엘리트 5세대’를 공개하며 온디바이스 인공지능의 진전을 강조했다.무대에 오른 비네쉬 수크마 퀄컴 테크날러지 제품 관리 부사장은 “우리는 20여 년간 AI를 다뤄왔지만 한 세대 만에 연산 속도를 37% 끌어올리고, 전력 효율을 16% 개선한 것은 기적에 가까운 성과”라며 “이 모든 것이 스냅드래곤 8 엘리트 5세대 안의 헥사곤(Hexagon) NPU 아키텍처 덕분”이라고 설명했다.이번 세대의 헥사곤 NPU는 벡터 코어, 스칼라 코어, 텐서 코어로 구성되며, 각각의 코어는 긴 문맥을 처리하는 프롬프트 가속화, 행렬 연산 최적화, 동적 형태와 은닉층 가속 등 대규모 모델 운용을 위한 기능을 담당한다. 코어 수 확장과 대역폭 개선으로 지연 시간을 줄이고 실시간 처리 성능을 높인 것도 특징이다.새로운 데이터 타입 도입 역시 눈길을 끈다. 수크마 부사장은 “FP8(부동소수점 8비트)과 INT2(2비트 정수) 지원은 토큰 처리 속도를 획기적으로 높인다”며 “특히 FP8은 별도의 변환 과정 없이 학습된 모델을 곧바로 실행할 수 있어 시장 출시 시간을 크게 단축한다”고 강조했다.퀄컴 스냅드래곤X2 NPU 성능, 경쟁사 비교 [사진=공동취재단]실제로 스냅드래곤 8 엘리트 5세대는 초당 220 토큰을 처리할 수 있으며, 이는 30억 파라미터 규모의 언어 모델을 스마트폰에서 실행하기에 충분한 성능이다.메모리 구조 개선도 이뤄졌다. 기존에는 대규모 모델을 잘게 나누어 메모리 여러 영역에 분산 저장해야 했지만, 이번 세대부터는 64비트 메모리 아키텍처를 적용해 단일 공간에서 모델을 운용할 수 있게 됐다. 이를 통해 불필요한 데이터 결합 과정이 사라지고 지연 시간이 줄어들었다. 또한 LPDDR5X 메모리를 초당 5.2GHz 속도로 구동해 약 80~90GB/s의 대역폭을 확보, 대규모 모델 구동에 필요한 안정적인 기반을 마련했다.[사진=공동취재단]수크마 부사장은 이러한 기술 투자의 목적을 ‘에이전틱 AI(Agentic AI)’로 규정했다.그는 “사용자의 의도를 이해하고, 반복 가능하며 설명 가능한 결과를비네쉬 수크마 퀄컴 테크날러지 제품 관리 부사장 [사진=공동취재단][디지털데일리 김문기 기자] “AI는 지금 속도의 시대(Speed is the mode)에 들어섰다. AI 성능이 더 이상 순간적인 시연에 머물지 않고, 사용자 일상 속에서 끊김 없는 경험으로 이어져야 한다."24일(현지시간) 퀄컴은 미국 마우이 라히아나 하얏트 리젠시 호텔에서 개최된 퀄컴 스냅드래곤 서밋 2025 무대에서 차세대 모바일 AI 플랫폼 ‘스냅드래곤 8 엘리트 5세대’를 공개하며 온디바이스 인공지능의 진전을 강조했다.무대에 오른 비네쉬 수크마 퀄컴 테크날러지 제품 관리 부사장은 “우리는 20여 년간 AI를 다뤄왔지만 한 세대 만에 연산 속도를 37% 끌어올리고, 전력 효율을 16% 개선한 것은 기적에 가까운 성과”라며 “이 모든 것이 스냅드래곤 8 엘리트 5세대 안의 헥사곤(Hexagon) NPU 아키텍처 덕분”이라고 설명했다.이번 세대의 헥사곤 NPU는 벡터 코어, 스칼라 코어, 텐서 코어로 구성되며, 각각의 코어는 긴 문맥을 처리하는 프롬프트 가속화, 행렬 연산 최적화, 동적 형태와 은닉층 가속 등 대규모 모델 운용을 위한 기능을 담당한다. 코어 수 확장과 대역폭 개선으로 지연 시간을 줄이고 실시간 처리 성능을 높인 것도 특징이다.새로운 데이터 타입 도입 역시 눈길을 끈다. 수크마 부사장은 “FP8(부동소수점 8비트)과 INT2(2비트 정수) 지원은 토큰 처리 속도를 획기적으로 높인다”며 “특히 FP8은 별도의 변환 과정 없이 학습된 모델을 곧바로 실행할 수 있어 시장 출시 시간을 크게 단축한다”고 강조했다.퀄컴 스냅드래곤X2 NPU 성능, 경쟁사 비교 [사진=공동취재단]실제로 스냅드래곤 8 엘리트 5세대는 초당 220 토큰을 처리할 수 있으며, 이는 30억 파라미터 규모의 언어 모델을 스마트폰에서 실행하기에 충분한 성능이다.메모리 구조 개선도 이뤄졌다. 기존에는 대규모 모델을 잘게 나누어 메모리 여러 영역에 분산 저장해야 했지만, 이번 세대부터는 64비트 메모리 아키텍처를 적용해 단일 공간에서 모델을 운용할 수 있게 됐다. 이를 통해 불필요한 데이터 결합 과정이 사라지고 지연 시간이 줄어들었다. 또한 LPDDR5X 메모리를 초당 5.2GHz 속도로 구동해 약 80~90GB/s의 대역폭을 확보, 대규모 모델 구동에 필요한 안정적인 기반을 마련했다.[사진=공동취재단]수크마 부사장은 이러한 기술 투자의 목적을 ‘에이전틱 AI(Agentic AI)’로 규정했다.그는 “사용자의 의도를 이해하고, 반복 가능하며 설명 가능한 결과를 빠르게 제공하는 것이 진정한 개인화 AI”라며 “이번 세대의 투
인천개인회생
- 이전글Sun Tzu 25.09.26
- 다음글How 9 Things Will Change The Way You Approach Top 10 Poker Sites 25.09.26
댓글목록
등록된 댓글이 없습니다.