Phison의 CEO는 244TB SSD, PLC NAND, 고대역폭 플래시가 좋은 아이디어가 아닌 이유에 대해 이야기했습니다.
기술 업계에서는 GPU가 AI 인프라에 매우 중요하다고 점점 더 이야기하고 있지만 실행할 수 있는 모델을 결정하는 제한 요소는 실제로 메모리입니다.
광범위한 인터뷰에서 세계 최초의 단일 칩 USB 플래시 드라이브를 발명한 Phison CEO Pua Khein Seng은 다음과 같이 말했습니다. TechRadar 프로 컴퓨팅의 초점은 로컬 추론이 가능한 노트북부터 AI 데이터 센터를 생성하는 하이퍼스케일러에 이르기까지 모든 곳에서 나타나는 보다 기본적인 제약으로 인해 산만해졌습니다.
“AI 모델에서 실제 병목 현상은 컴퓨팅 성능이 아니라 메모리입니다.”라고 Pua는 말했습니다. “메모리가 부족하면 시스템이 충돌합니다.”
DRAM 한계 보상
이것이 회사가 CES 2026에서 공개적으로 논의한 Phison의 aiDAPTIV+ 작업의 배경이며, 이는 본질적으로 NAND 플래시를 메모리 풀로 사용하여 AI 처리를 임베디드 GPU 시스템으로 확장하는 방법입니다.
Pua는 이를 SSD 용량을 사용하여 DRAM 제한을 상쇄하고 GPU가 메모리를 기다리는 대신 컴퓨팅에 집중하도록 하는 것으로 설명합니다.
“우리의 발명품은 SSD를 DRAM 메모리의 보완재로 사용합니다.”라고 그는 말합니다. “우리는 이것을 메모리 확장으로 사용합니다.”
실질적인 목표는 추론 중 응답성, 특히 첫 번째 토큰까지의 시간, 요청 전송과 첫 번째 출력 확인 사이의 지연을 개선하는 것입니다. Pua는 긴 TTFT가 모델이 작업을 완료한 경우에도 로컬 AI가 손상된 느낌을 준다고 주장합니다.
“장치에 무언가를 요청하고 첫 번째 단어가 나올 때까지 60초를 기다려야 한다면 기다리시겠습니까?” 그는 “무언가를 물으면 2초만 기다리면 되는데, 10초가 걸리면 사용자들은 쓰레기라고 생각할 것”이라고 말했다.
Pua는 TTFT 개선 사항을 메모리 집약적 추론 데이터, 특히 KV 캐시의 더 나은 재사용과 연결하여 의사가 방문 사이에 아무것도 저장되지 않기 때문에 모든 환자에게 동일한 지시를 반복하는 것에 비유합니다.
“AI 추론에는 KV 캐시라는 것이 있습니다. 이는 웹 브라우징의 쿠키와 같습니다.”라고 그는 확장했습니다. “대부분의 시스템에는 DRAM이 충분하지 않기 때문에 동일한 질문을 할 때마다 다시 계산해야 합니다.”
Pua는 Phison의 접근 방식은 “자주 사용하는 캐시를 저장소에 저장”하여 사용자가 쿼리를 반복하거나 수정할 때 시스템이 이를 신속하게 검색할 수 있도록 하는 것이라고 덧붙였습니다.
Pua는 많은 조직이 컴퓨팅 성능이 아니라 더 많은 VRAM을 수집하기 위해 추가 GPU를 구입하므로 실리콘 낭비가 발생한다고 지적하면서 이러한 메모리 프레이밍은 노트북을 넘어 기업이 GPU 서버를 구축하는 방법까지 확장됩니다.
“우리 솔루션이 없으면 사람들은 주로 컴퓨팅 성능이 아닌 메모리 통합을 위해 여러 개의 GPU 카드를 구입합니다.”라고 그는 덧붙입니다. “이 값비싼 GPU의 대부분은 메모리에만 사용되기 때문에 유휴 상태가 됩니다.”
SSD가 더 큰 메모리 풀을 제공할 수 있다면 GPU를 구입하여 계산을 위해 확장할 수 있다고 Pua는 말합니다. “메모리가 충분하면 컴퓨팅 속도에 집중할 수 있습니다. GPU 하나가 느리면 GPU를 2개, 4개 또는 8개 추가하여 컴퓨팅 성능을 향상시킬 수 있습니다.”라고 그는 말합니다.
244TB SSD
거기에서 Pua는 하이퍼스케일러와 AI 인프라의 경제성으로 시야를 넓혀 AI 비즈니스 사례가 추론에 의존하고 추론이 데이터 스토리지에 의존하기 때문에 필요하지만 불완전한 GPU 지출의 현재 물결을 설명했습니다.
“CSP는 GPU에 2,000억 달러 이상을 투자했습니다.”라고 그는 말합니다. “그들은 GPU에서 직접 돈을 벌지 않습니다. 수익은 막대한 데이터 저장이 필요한 추론에서 나옵니다.”
그는 반복해서 언급한 문구로 상황을 요약했습니다. “CSP 이익은 스토리지 용량과 동일합니다.”
이 주장은 또한 Phison이 극한 용량의 기업용 SSD를 추진하는 데에도 기여합니다. 회사는 244TB 모델을 발표했고 Pua는 “현재 122TB 드라이브는 16단 NAND 스택이 있는 X2 컨트롤러를 사용합니다. 244TB에 도달하려면 32단 스택만 필요합니다. 디자인은 완료되었지만 제조 성능이 문제입니다.”라고 말했습니다.
그는 또한 더 높은 밀도의 NAND 어레이라는 흥미로운 대안 경로를 설명했습니다. “우리는 4TB NAND 어레이를 기다리고 있습니다. 이를 통해 단 16개 레이어만으로 244TB를 달성할 수 있습니다.”라고 그는 말하면서 시기는 제조 성숙도에 따라 달라질 것이라고 덧붙였습니다.
PLC NAND의 경우 Pua는 Phison이 출시될 때 제어할 수 없다는 점을 분명히 밝혔지만 제조업체가 안정적으로 출시할 수 있을 때 지원할 계획이라고 말했습니다.
“PLC는 5비트 NAND이며 이는 주로 우리가 아닌 NAND 제조업체의 결정입니다.”라고 그는 말했습니다. “NAND 회사의 PLC 기술이 성숙해짐에 따라 우리의 SSD 설계도 이를 지원할 준비가 되어 있을 것입니다.”
그는 다른 스토리지 추세에 대해 더 회의적이었습니다. 즉, 플래시를 GPU 스타일 메모리 스택에 직접 연결하고 때로는 고대역폭 플래시로 묶이는 것입니다. Pua는 저항 불일치가 불쾌한 실패 모드를 생성한다고 주장했습니다.
“NAND를 GPU와 직접 통합하는 데 따른 과제는 쓰기 주기 제한입니다.”라고 그는 말했습니다. “NAND에는 유한한 프로그램/삭제 주기가 있습니다. 이를 통합하면 NAND의 수명이 다하면 GPU 카드의 전체 표면을 폐기해야 합니다.”
Phison이 선호하는 모델은 모듈식입니다. “SSD를 교체 가능한 플러그 앤 플레이 구성 요소로 유지합니다. SSD가 마모되면 GPU 측면을 유지하면서 간단히 교체하면 됩니다.”
전반적으로 AI 하드웨어의 미래에 대한 Pua의 비전은 더 큰 GPU를 추구하는 것보다 메모리 용량이 저렴하고 확장 가능하며 교체 가능한 시스템을 구축하는 것입니다.
목표가 임베디드 GPU에 대한 로컬 추론이든 하이퍼스케일러에 대한 프레임 규모 추론이든 관계없이 회사는 스토리지 밀도와 메모리 확장이 컴퓨팅에서 또 다른 도약을 이루기 훨씬 전에 실용적인 것이 무엇인지 결정할 것이라고 확신하고 있습니다.
Google 뉴스에서 TechRadar 팔로우 나 우리를 즐겨찾는 소스로 추가하세요 귀하의 피드에서 전문가로부터 뉴스, 리뷰 및 의견을 받으십시오. 팔로우 버튼을 꼭 눌러주세요!
물론 당신도 할 수 있다 TikTok에서 TechRadar 팔로우 뉴스, 리뷰, 비디오 언박싱을 받고 정기적인 업데이트를 받기 위해 왓츠앱 ~도
