MÔ TẢ CÔNG VIỆC
-
Thiết kế & xây dựng hệ thống AI inference phân tán (multi-worker, multi-region)
-
Triển khai kiến trúc streaming real-time cho audio và token
-
Phát triển networking layer hiệu năng cao
-
Xây dựng intelligent routing (theo latency, cost, network condition)
-
Tối ưu end-to-end latency: network → prefill → decode → audio output
-
Điều phối hybrid giữa local GPU, cloud và API fallback
YÊU CẦU
-
3+ năm kinh nghiệm backend / distributed systems
-
Thành thạo Golang hoặc Rust. C++/Java là điểm cộng
-
Kiến thức mạng vững:
-
TCP/IP, HTTP2, WebSocket, QUIC
-
Congestion control, backpressure
-
Hệ thống streaming độ trễ thấp
-
-
Có kinh nghiệm LLM inference hoặc streaming ASR/TTS
-
Hiểu sâu về thiết kế hệ thống phân tán
Điểm cộng lớn
-
Kinh nghiệm WebRTC / real-time media
-
Từng xây dựng streaming TTS hoặc full-duplex speech system
-
Làm việc với vLLM / llama.cpp / ONNX / TensorRT
-
Triển khai hybrid cloud + bare-metal
QUYỀN LỢI
- Thu nhập hấp dẫn, lên đến 35 triệu, hoặc hơn deal theo năng lực.
- Các chế độ phúc lợi khác của công ty: lương kết quả kinh doanh, thưởng nóng, vinh danh, quà lễ tết, sinh nhật.
- Được trực tiếp tham gia vào quá trình hoàn thiện các sản phẩm thông minh tại Công ty smarthome số 1 tại Việt Nam.
- Được đào tạo và trang bị những kiến thức chuyên sâu về ngành điện tử thông minh. Đề cao sự chia sẻ, văn hóa học hỏi.
- Hạ tầng công nghệ đỉnh cao: Trực tiếp điều phối hybrid giữa Local GPU, Cloud và API fallback. Cơ hội làm việc với hệ thống AI Inference phân tán.
- Văn hóa “Học để dẫn đầu”: Đào tạo chuyên sâu về Smart Home, chia sẻ kiến thức định kỳ. Đề cao văn hóa học hỏi và sáng tạo không giới hạn.
- Cơ hội thăng tiến cao.
- Hưởng đầy đủ các chế độ BHXH theo luật lao động
- Du lịch cùng công ty ít nhất 2 lần/ năm. Môi trường làm việc trẻ trung năng động, nhiều hoạt động nội bộ với câu lạc bộ thể thao bóng đá, cầu lông.. Và có khu vực thể thao rèn luyện sức khỏe, giải trí ngay tại văn phòng: bóng bàn, phi tiêu, board game.
