NPU Runtime Software Engineer (LLM Serving) | 커리어핏

✨ 리벨리온에서 NPU Runtime Software Engineer (LLM Serving) 전문가를 찾습니다! ✨

🚀 한 줄 요약: 리벨리온에서 NPU 기반 LLM 서빙을 위한 런타임 소프트웨어 엔지니어를 채용합니다.

🤔 어떤 팀에서 일하게 되나요?

소속 팀/부서: NPU Runtime 팀 (LLM 서빙을 위한 최적화 및 배포 담당)

💡 주요 업무:

낮은 지연 시간과 높은 처리량을 위한 LLM 추론 파이프라인 설계, 구현 및 최적화
NPU에서 추론 성능 향상을 위해 vLLM 개발 및 확장 (Continuous Batching, PagedAttention 지원 포함)
메모리 관리, 병렬 처리 및 동적 배치 전략 개선을 위한 맞춤형 vLLM 확장 구현
NPU에서 모델 실행 가속화를 위해 torch.compile 및 RBLN 컴파일러 도구 체인 작업
LLM 추론 워크로드를 위한 그래프 변환, 연산자 융합 및 실행 효율성 최적화

✅ 꼭 필요해요:

Python 및 딥러닝 프레임워크 (PyTorch, TensorFlow) 능숙
Transformer 기반 모델 및 추론 최적화 기술을 포함한 LLM 아키텍처에 대한 깊은 이해
LLM 서빙 프레임워크 (예: vLLM, TensorRT-LLM) 사용 경험
텐서 병렬 처리, KV 캐시 최적화 및 메모리 효율적인 실행을 포함한 모델 최적화 기술에 대한 확실한 이해
하드웨어 가속 (GPU, NPU, TPU) 및 효율적인 메모리 관리 기술에 대한 이해

🌟 이런 분이면 더 좋아요:

컴파일러 및 런타임 최적화 경험
C++ 경험 (특히 성능이 중요한 런타임 최적화)
torch.compile 및 그래프 최적화에 대한 이해
분산 환경에서 LLM 배포 경험
오픈 소스 LLM 서빙 프로젝트 기여 경험

💰 연봉 및 복지:

연봉: 회사 내규에 따름 (추정 연봉 범위: 약 5,000만원 - 8,000만원 (추정치))
주요 복지:
- (공고에 명시적인 복지 정보는 없으나) 일반적으로 IT 업계 수준의 복지 제공 예상

📍 근무지:

대한민국 경기도 성남시 분당구 정자일로 239, 102동 8층

🗓️ 지원 방법 및 절차:

지원 기간: 채용 시 마감
지원 방법: https://rebellions.career.greetinghr.com/o/146156
채용 절차: 서류 전형 → On-line 인터뷰 → On-site 인터뷰 → Culture-fit 인터뷰 → 처우협의 → 최종 합격

🙋‍♀️ 지원자가 궁금해할 만한 Q&A:

Q1: NPU Runtime 경험이 없어도 지원 가능한가요?
- A: NPU Runtime 경험이 필수는 아니지만, GPU, TPU 등 다른 하드웨어 가속 경험과 LLM에 대한 깊은 이해가 있다면 충분히 지원 가능합니다.
Q2: vLLM 외 다른 LLM Serving Framework 경험도 인정되나요?
- A: 네, TensorRT-LLM 등 다른 LLM Serving Framework 경험도 LLM Serving에 대한 이해도를 보여주는 좋은 지표가 될 수 있습니다.
Q3: 리벨리온의 조직 문화는 어떤가요?
- A: 공고에는 명시되어 있지 않지만, 일반적으로 스타트업 문화를 가지고 있으며, 수평적인 소통과 빠른 의사결정을 지향할 것으로 예상됩니다.

📢 리벨리온의 NPU Runtime Software Engineer (LLM Serving)에 관심 있다면 지금 바로 지원하세요!

#리벨리온 #NPU #LLM #AI #채용 #소프트웨어엔지니어

나에게 맞는 더 많은 채용 공고를 보고 싶다면?

지금 내 이력서에 딱 맞는 채용 공고를 확인해 보세요!