화웨이, AI 응답 속도 높였다…“추론 처리량 최대 372% 향상”
newsare.net
화웨이가 차이나모바일 후베이와 함께 AI 추론 가속 솔루션의 상용망 검증을 완료했다. 장문 AI 환경에서 토큰 처리량을 최대 372% 향상시켰다.화웨이, AI 응답 속도 높였다…“추론 처리량 최대 372% 향상”
화웨이가 차이나모바일 후베이와 함께 AI 추론 가속 솔루션의 상용망 검증을 완료했다. 장문 AI 환경에서 토큰 처리량을 최대 372% 향상시켰다. Read more












