Algorithm Powers Innovation
算法驅動創(chuàng)新
Algorithm Powers Innovation
算法驅動創(chuàng)新
實習生招聘
華為云業(yè)務快速增長,算法需求不斷增加,特開放以下崗位,歡迎有識之士加入算法創(chuàng)新Lab。
有意向的同學請發(fā)送簡歷到招聘郵箱AlgInnovLab@huawei.com,我們將盡快聯(lián)系您。
崗位
工作地點
工作職責
技能要求
備注
昇騰算子實習生
上海、西安、深圳、北京
1. 充分利用NPU硬件結構設計以及網(wǎng)絡模型結構,使用多核流水并行、內存管理優(yōu)化、算子融合等關鍵技術,構建高性能、低時延、低消耗cube、vector基礎&融合算子,使能大模型性能提升
2. 參與面向下一代算子相關自動化工具、自動化平臺等設計與開發(fā)。
1、即將取得計算機、軟件、電子信息類等相關專業(yè)本科及以上學歷,編程基礎扎實。
2. 具有C/C++編程經驗。
2. 了解AI網(wǎng)絡模型和AI算子基礎知識,如Flashattention、AllToAll、融合算子、量化算子等。
3. 了解昇騰AI處理器基礎知識。
4. 工作認真負責。有偏硬件特別是芯片的編程經驗者優(yōu)先。
相關項目:
大模型訓練實習生
上海、西安、深圳、北京
1.探索新型大模型架構及其預訓練、后訓練、模型微調等技術,提升大模型在復雜場景下的泛化能力和訓練性能。
2.優(yōu)化訓練吞吐量,通過并行策略、算子融合、通信優(yōu)化、計算-通信重疊、顯存優(yōu)化等方法提升集群利用率,加快模型吞吐,降低訓練成本。
3.持續(xù)跟蹤如MoE架構、長序列、混合精度訓練等前沿方向,輸出新算法洞察與創(chuàng)新IDEA。
1、即將取得計算機、軟件、人工智能等相關專業(yè)本科及以上學歷,編程基礎扎實。
2、熟悉常見的AI網(wǎng)絡模型結構、如Deepseek,Transformer底層原理。
3、熟悉常用的深度學習框架,如Pytorch/DeepSpeed/Megatron/Colossal-AI等分布式框架者優(yōu)先,有實際大模型、AIGC模型落地經驗者優(yōu)先。
4、有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。
相關項目:
大模型推理實習生
上海、西安、深圳、北京
1. 參與全場景AI推理框架的架構設計、技術選型、關鍵技術研究及核心代碼開發(fā)工作
2. 參與并行分布式策略、高性能算子、小型化工具(量化、稀疏、剪枝)、高性能代碼自動生成相關設計與開發(fā)工作,提升模型壓縮與推理性能
3. 參與分布式推理、異構并行推理的設計和調優(yōu)、開發(fā),實現(xiàn)大模型推理的性能和擴展性領先和項目落地
1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。
2、掌握常用的深度學習框架,如Pytorch、MindSpore、Tensorflow等優(yōu)先,有CV/NLP/機器學習等落地經驗者優(yōu)先。
3、掌握Python/C/C++/Java/Go任意一種編程語言,熟悉分布式、微服務、數(shù)據(jù)庫等技術。
4、掌握LLM、AIGC相關落地經驗、有大模型部署、推理、微調、增訓、評測、量化等經驗,熟悉vllm/TGI者優(yōu)先。
5、熟悉deepspeed/tensor-llm/ascendspeed等加速庫者優(yōu)先。
6. 有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。
相關項目:
軟件研發(fā)實習生
上海、西安、深圳、北京
1、分布式訓練框架開發(fā):設計基于GPU/NPU集群的大規(guī)模并行訓練架構,優(yōu)化數(shù)據(jù)/模型/流水線并行策略,實現(xiàn)千卡級資源利用率突破(如Horovod/DeepSpeed深度定制)。
2、高性能計算優(yōu)化:開發(fā)算子級加速庫(CUDA/TensorRT),突破內存墻/通信瓶頸,針對LLM/Vision模型優(yōu)化計算圖編譯與顯存復用策略。
3、推理引擎架構設計:構建低延遲服務框架,實現(xiàn)動態(tài)批處理、模型切片、量化蒸餾等生產級部署方案,支持萬億參數(shù)模型毫秒級響應。
1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。
2、熟練掌握java/python/C/go等編程語言一種或多種,理解并熟練應用常見設計模式。
3、 有分布式訓練框架,推理引擎框架設計開發(fā)經驗者優(yōu)先。
4、對開源社區(qū)廣泛運用的軟件源碼熟悉,或有貢獻者優(yōu)先。
5、ICPC/CCPC競賽獲獎者,或熟悉AI算法,或熟悉運籌優(yōu)化算法等優(yōu)先。
AI算法實習生
上海、西安、深圳、北京
1、 通過算法技術創(chuàng)新,不斷突破業(yè)界領先指標,協(xié)同軟件技術創(chuàng)新,構筑算法競爭力。
2、 持續(xù)輸出新算法洞察,創(chuàng)新IDEA,領先算法設計,突破性算法技術,Clean Code高質量代碼等。
3、算法技術創(chuàng)新領域包括計算機算法與數(shù)據(jù)結構、大模型設計、大模型訓練推理、機器學習、數(shù)據(jù)挖掘、存儲算法等,通過算法解決云服務分布式大規(guī)模場景下的各種挑戰(zhàn)。并能與軟件引擎融合創(chuàng)新,構筑競爭力。
1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、精通如下一種或幾種技能,機器學習、強化學習、深度學習、壓縮算法、緩存算法、組合優(yōu)化、整數(shù)/線性規(guī)劃等。
4、ICPC/CCPC/數(shù)模競賽等獲獎者優(yōu)先,有相關專利和學術期刊或會議論文發(fā)表者優(yōu)先。
AI Agent研發(fā)實習生
上海、西安、深圳、北京
1、復雜決策算法設計:構建基于強化學習、規(guī)劃推理的多模態(tài)Agent框架,解決動態(tài)環(huán)境中的長周期任務分解與協(xié)同優(yōu)化問題,需平衡實時性與泛化性。
2、系統(tǒng)工程化落地:實現(xiàn)大規(guī)模訓練/推理框架的高效部署,解決多模塊(感知、決策、執(zhí)行)的端到端協(xié)同及資源調度瓶頸,保障低延遲、高可靠生產級運行。
3、未知場景泛化突破:通過元學習、因果推理等技術提升Agent對未見過業(yè)務場景的快速適應能力,突破數(shù)據(jù)/規(guī)則邊界,需融合領域知識建模與零樣本遷移技術。
1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、熟悉掌握業(yè)界AIAgent的開發(fā)框架,如LangChain, llamaindex,AutoGen, QwenAgent等其中一種或多種。
相關項目:
1、AI智能體
AI編譯器研發(fā)實習生
上海、西安、深圳、北京
1、參與AI編譯器的設計與開發(fā),優(yōu)化AI模型在昇騰硬件的編譯與部署效率。
2、研究LLVM、MLIR等編譯器框架,構建高性能算子自動生成、圖優(yōu)化、內存優(yōu)化等技術方案
3、與算法團隊合作設計編譯友好的大模型架構,推動MoE、混合精度訓練等技術的編譯器級支持
4、探索AI與編譯技術的結合方向(如自動并行化、動態(tài)shape優(yōu)化、稀疏計算加速等)
1、即將取得計算機/人工智能/電子工程/數(shù)學等相關專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、深入理解大模型技術棧(Megatron/DeepSpeed/ColossalAI),熟悉LLM訓練/推理的顯存與算力瓶頸。
4、熟悉GPU/昇騰NPU結構,了解LLVM/MLIR/TVM/Triton等AI編譯器經驗者優(yōu)先。