엔비디아(http://www.nvidia.co.kr/, CEO 젠슨황)가 파스칼(Pascal) GPU 아키텍처 기반의 딥 러닝 플랫폼인 테슬라(Tesla) P4, P40 가속기를 공개했다.
테슬라 P4와 P40은 엔비디아의 최신 GPU 아키텍처인 파스칼을 기반으로 음성, 이미지 또는 텍스트를 인식하기 위해 훈련된 심층 신경망을 구동한다. 특히 8비트(INT8) 기반의 특수 추론 명령을 사용해 CPU 대비 45배, 지난 1년 내 출시된 GPU 솔루션 대비 4배 더 빠른 속도로 추론 작업을 실행하는 등 인공지능 추론에 특화된 성능을 제공한다.
테슬라 P4는 작은 사이즈의 폼팩터와 50W(와트)의 저전력 디자인으로 최고 수준의 에너지 효율을 필요로 하는 데이터 센터에 적합하다. CPU 기반의 추론 작업과 비교했을 때 40배 더 뛰어난 수준의 에너지 효율을 제공한다고 볼 수 있다. 가령 하나의 테슬라 P4은 영상 추론 작업에서 13대의 CPU 단일 서버를 대체할 수 있기 때문에 서버 구입 및 전력 비용을 모두 포괄하는 총소유비용(TCO)에 있어 8배 이상의 절감 효과를 기대할 수 있다.
이처럼 테슬라 P4가 에너지 효율에 특화됐다면, 테슬라 P40은 달리 최고 수준의 딥 러닝 작업 처리 성능을 제공하는데 주력하는 제품이다. 8개의 테슬라 P40 가속기를 탑재한 서버는 44 TOPS INT8(새로운 딥 러닝 추론 명령어)의 성능을 갖추게 되며, 140대 이상의 CPU 기반 서버를 대체 가능하다.
김원영 기자 goora@noteforum.co.kr
[디지털 모바일 IT 전문 정보 - 노트포럼]
Copyrights ⓒ 노트포럼, 무단전재 및 재배포 금지