亚洲狼友综合在线导航|国产在线拍揄自揄拍无码男男|跪求一个免费的黄色在线网址|国产r级片在线观看完整版视频|国产欧美亚洲日本视频|视频成人一二区啊轻点插|免费观看!毛片久热久|欧美成人高清导航|无码高清色情97视频在线|精品黄色成人网站在线观看

Algorithm Powers Innovation

算法驅動創(chuàng)新

Algorithm Powers Innovation

算法驅動創(chuàng)新

實習生招聘

華為云業(yè)務快速增長,算法需求不斷增加,特開放以下崗位,歡迎有識之士加入算法創(chuàng)新Lab。


有意向的同學請發(fā)送簡歷到招聘郵箱AlgInnovLab@huawei.com,我們將盡快聯(lián)系您。

崗位

工作地點

工作職責

技能要求

備注

昇騰算子實習生

上海、西安、深圳、北京

1. 充分利用NPU硬件結構設計以及網(wǎng)絡模型結構,使用多核流水并行、內存管理優(yōu)化、算子融合等關鍵技術,構建高性能、低時延、低消耗cube、vector基礎&融合算子,使能大模型性能提升

2. 參與面向下一代算子相關自動化工具、自動化平臺等設計與開發(fā)。

1、即將取得計算機、軟件、電子信息類等相關專業(yè)本科及以上學歷,編程基礎扎實。

2. 具有C/C++編程經驗。

2. 了解AI網(wǎng)絡模型和AI算子基礎知識,如Flashattention、AllToAll、融合算子、量化算子等。

3. 了解昇騰AI處理器基礎知識。

4. 工作認真負責。有偏硬件特別是芯片的編程經驗者優(yōu)先。

相關項目:

1、軟硬件結合的高性能算子

大模型訓練實習生

上海、西安、深圳、北京

1.探索新型大模型架構及其預訓練、后訓練、模型微調等技術,提升大模型在復雜場景下的泛化能力和訓練性能。

2.優(yōu)化訓練吞吐量,通過并行策略、算子融合、通信優(yōu)化、計算-通信重疊、顯存優(yōu)化等方法提升集群利用率,加快模型吞吐,降低訓練成本。

3.持續(xù)跟蹤如MoE架構、長序列、混合精度訓練等前沿方向,輸出新算法洞察與創(chuàng)新IDEA。

1、即將取得計算機、軟件、人工智能等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、熟悉常見的AI網(wǎng)絡模型結構、如Deepseek,Transformer底層原理。

3、熟悉常用的深度學習框架,如Pytorch/DeepSpeed/Megatron/Colossal-AI等分布式框架者優(yōu)先,有實際大模型、AIGC模型落地經驗者優(yōu)先。

4、有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。

相關項目:

1、大模型訓推加速技術

大模型推理實習生

上海、西安、深圳、北京

1. 參與全場景AI推理框架的架構設計、技術選型、關鍵技術研究及核心代碼開發(fā)工作

2. 參與并行分布式策略、高性能算子、小型化工具(量化、稀疏、剪枝)、高性能代碼自動生成相關設計與開發(fā)工作,提升模型壓縮與推理性能

3. 參與分布式推理、異構并行推理的設計和調優(yōu)、開發(fā),實現(xiàn)大模型推理的性能和擴展性領先和項目落地

1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、掌握常用的深度學習框架,如Pytorch、MindSpore、Tensorflow等優(yōu)先,有CV/NLP/機器學習等落地經驗者優(yōu)先。

3、掌握Python/C/C++/Java/Go任意一種編程語言,熟悉分布式、微服務、數(shù)據(jù)庫等技術。

4、掌握LLM、AIGC相關落地經驗、有大模型部署、推理、微調、增訓、評測、量化等經驗,熟悉vllm/TGI者優(yōu)先。

5、熟悉deepspeed/tensor-llm/ascendspeed等加速庫者優(yōu)先。

6. 有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。

相關項目:

1、大模型訓推加速技術

軟件研發(fā)實習生

上海、西安、深圳、北京

1、分布式訓練框架開發(fā):設計基于GPU/NPU集群的大規(guī)模并行訓練架構,優(yōu)化數(shù)據(jù)/模型/流水線并行策略,實現(xiàn)千卡級資源利用率突破(如Horovod/DeepSpeed深度定制)。

2、高性能計算優(yōu)化:開發(fā)算子級加速庫(CUDA/TensorRT),突破內存墻/通信瓶頸,針對LLM/Vision模型優(yōu)化計算圖編譯與顯存復用策略。

3、推理引擎架構設計:構建低延遲服務框架,實現(xiàn)動態(tài)批處理、模型切片、量化蒸餾等生產級部署方案,支持萬億參數(shù)模型毫秒級響應。

1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、熟練掌握java/python/C/go等編程語言一種或多種,理解并熟練應用常見設計模式。

3、 有分布式訓練框架,推理引擎框架設計開發(fā)經驗者優(yōu)先。

4、對開源社區(qū)廣泛運用的軟件源碼熟悉,或有貢獻者優(yōu)先。

5、ICPC/CCPC競賽獲獎者,或熟悉AI算法,或熟悉運籌優(yōu)化算法等優(yōu)先。

— —

AI算法實習生

上海、西安、深圳、北京

1、 通過算法技術創(chuàng)新,不斷突破業(yè)界領先指標,協(xié)同軟件技術創(chuàng)新,構筑算法競爭力。

2、 持續(xù)輸出新算法洞察,創(chuàng)新IDEA,領先算法設計,突破性算法技術,Clean Code高質量代碼等。

3、算法技術創(chuàng)新領域包括計算機算法與數(shù)據(jù)結構、大模型設計、大模型訓練推理、機器學習、數(shù)據(jù)挖掘、存儲算法等,通過算法解決云服務分布式大規(guī)模場景下的各種挑戰(zhàn)。并能與軟件引擎融合創(chuàng)新,構筑競爭力。

1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、精通如下一種或幾種技能,機器學習、強化學習、深度學習、壓縮算法、緩存算法、組合優(yōu)化、整數(shù)/線性規(guī)劃等。

4、ICPC/CCPC/數(shù)模競賽等獲獎者優(yōu)先,有相關專利和學術期刊或會議論文發(fā)表者優(yōu)先。

— —

AI Agent研發(fā)實習生

上海、西安、深圳、北京

1、復雜決策算法設計:構建基于強化學習、規(guī)劃推理的多模態(tài)Agent框架,解決動態(tài)環(huán)境中的長周期任務分解與協(xié)同優(yōu)化問題,需平衡實時性與泛化性。

2、系統(tǒng)工程化落地:實現(xiàn)大規(guī)模訓練/推理框架的高效部署,解決多模塊(感知、決策、執(zhí)行)的端到端協(xié)同及資源調度瓶頸,保障低延遲、高可靠生產級運行。

3、未知場景泛化突破:通過元學習、因果推理等技術提升Agent對未見過業(yè)務場景的快速適應能力,突破數(shù)據(jù)/規(guī)則邊界,需融合領域知識建模與零樣本遷移技術。

1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、熟悉掌握業(yè)界AIAgent的開發(fā)框架,如LangChain, llamaindex,AutoGen, QwenAgent等其中一種或多種。

相關項目:

1、AI智能體

AI編譯器研發(fā)實習生

上海、西安、深圳、北京

1、參與AI編譯器的設計與開發(fā),優(yōu)化AI模型在昇騰硬件的編譯與部署效率。

2、研究LLVM、MLIR等編譯器框架,構建高性能算子自動生成、圖優(yōu)化、內存優(yōu)化等技術方案

3、與算法團隊合作設計編譯友好的大模型架構,推動MoE、混合精度訓練等技術的編譯器級支持

4、探索AI與編譯技術的結合方向(如自動并行化、動態(tài)shape優(yōu)化、稀疏計算加速等)

1、即將取得計算機/人工智能/電子工程/數(shù)學等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、深入理解大模型技術棧(Megatron/DeepSpeed/ColossalAI),熟悉LLM訓練/推理的顯存與算力瓶頸。

4、熟悉GPU/昇騰NPU結構,了解LLVM/MLIR/TVM/Triton等AI編譯器經驗者優(yōu)先。

— —

昇騰算子實習生

工作地點

上海、西安、深圳、北京

工作職責

1. 充分利用NPU硬件結構設計以及網(wǎng)絡模型結構,使用多核流水并行、內存管理優(yōu)化、算子融合等關鍵技術,構建高性能、低時延、低消耗cube、vector基礎&融合算子,使能大模型性能提升

2. 參與面向下一代算子相關自動化工具、自動化平臺等設計與開發(fā)。

技能要求

1、即將取得計算機、軟件、電子信息類等相關專業(yè)本科及以上學歷,編程基礎扎實。

2. 具有C/C++編程經驗。

2. 了解AI網(wǎng)絡模型和AI算子基礎知識,如Flashattention、AllToAll、融合算子、量化算子等。

3. 了解昇騰AI處理器基礎知識。

4. 工作認真負責。有偏硬件特別是芯片的編程經驗者優(yōu)先。

備注

大模型訓練實習生

工作地點

上海、西安、深圳、北京

工作職責

1.探索新型大模型架構及其預訓練、后訓練、模型微調等技術,提升大模型在復雜場景下的泛化能力和訓練性能。

2.優(yōu)化訓練吞吐量,通過并行策略、算子融合、通信優(yōu)化、計算-通信重疊、顯存優(yōu)化等方法提升集群利用率,加快模型吞吐,降低訓練成本。

3.持續(xù)跟蹤如MoE架構、長序列、混合精度訓練等前沿方向,輸出新算法洞察與創(chuàng)新IDEA。

技能要求

1、即將取得計算機、軟件、人工智能等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、熟悉常見的AI網(wǎng)絡模型結構、如Deepseek,Transformer底層原理。

3、熟悉常用的深度學習框架,如Pytorch/DeepSpeed/Megatron/Colossal-AI等分布式框架者優(yōu)先,有實際大模型、AIGC模型落地經驗者優(yōu)先。

4、有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。

備注

相關項目:

1、大模型訓推加速技術

大模型推理實習生

工作地點

上海、西安、深圳、北京

工作職責

1. 參與全場景AI推理框架的架構設計、技術選型、關鍵技術研究及核心代碼開發(fā)工作

2. 參與并行分布式策略、高性能算子、小型化工具(量化、稀疏、剪枝)、高性能代碼自動生成相關設計與開發(fā)工作,提升模型壓縮與推理性能

3. 參與分布式推理、異構并行推理的設計和調優(yōu)、開發(fā),實現(xiàn)大模型推理的性能和擴展性領先和項目落地

技能要求

1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、掌握常用的深度學習框架,如Pytorch、MindSpore、Tensorflow等優(yōu)先,有CV/NLP/機器學習等落地經驗者優(yōu)先。

3、掌握Python/C/C++/Java/Go任意一種編程語言,熟悉分布式、微服務、數(shù)據(jù)庫等技術。

4、掌握LLM、AIGC相關落地經驗、有大模型部署、推理、微調、增訓、評測、量化等經驗,熟悉vllm/TGI者優(yōu)先。

5、熟悉deepspeed/tensor-llm/ascendspeed等加速庫者優(yōu)先。

6. 有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。

備注

相關項目:

1、大模型訓推加速技術

軟件研發(fā)實習生

工作地點

上海、西安、深圳、北京

工作職責

1、分布式訓練框架開發(fā):設計基于GPU/NPU集群的大規(guī)模并行訓練架構,優(yōu)化數(shù)據(jù)/模型/流水線并行策略,實現(xiàn)千卡級資源利用率突破(如Horovod/DeepSpeed深度定制)。

2、高性能計算優(yōu)化:開發(fā)算子級加速庫(CUDA/TensorRT),突破內存墻/通信瓶頸,針對LLM/Vision模型優(yōu)化計算圖編譯與顯存復用策略。

3、推理引擎架構設計:構建低延遲服務框架,實現(xiàn)動態(tài)批處理、模型切片、量化蒸餾等生產級部署方案,支持萬億參數(shù)模型毫秒級響應。

技能要求

1、即將取得計算機、軟件等相關專業(yè)本科及以上學歷,編程基礎扎實。

2、熟練掌握java/python/C/go等編程語言一種或多種,理解并熟練應用常見設計模式。

3、 有分布式訓練框架,推理引擎框架設計開發(fā)經驗者優(yōu)先。

4、對開源社區(qū)廣泛運用的軟件源碼熟悉,或有貢獻者優(yōu)先。

5、ICPC/CCPC競賽獲獎者,或熟悉AI算法,或熟悉運籌優(yōu)化算法等優(yōu)先。

備注

— —

AI算法實習生

工作地點

上海、西安、深圳、北京

工作職責

1、 通過算法技術創(chuàng)新,不斷突破業(yè)界領先指標,協(xié)同軟件技術創(chuàng)新,構筑算法競爭力。

2、 持續(xù)輸出新算法洞察,創(chuàng)新IDEA,領先算法設計,突破性算法技術,Clean Code高質量代碼等。

3、算法技術創(chuàng)新領域包括計算機算法與數(shù)據(jù)結構、大模型設計、大模型訓練推理、機器學習、數(shù)據(jù)挖掘、存儲算法等,通過算法解決云服務分布式大規(guī)模場景下的各種挑戰(zhàn)。并能與軟件引擎融合創(chuàng)新,構筑競爭力。

技能要求

1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、精通如下一種或幾種技能,機器學習、強化學習、深度學習、壓縮算法、緩存算法、組合優(yōu)化、整數(shù)/線性規(guī)劃等。

4、ICPC/CCPC/數(shù)模競賽等獲獎者優(yōu)先,有相關專利和學術期刊或會議論文發(fā)表者優(yōu)先。

備注

— —

AI Agent研發(fā)實習生

工作地點

上海、西安、深圳、北京

工作職責

1、復雜決策算法設計:構建基于強化學習、規(guī)劃推理的多模態(tài)Agent框架,解決動態(tài)環(huán)境中的長周期任務分解與協(xié)同優(yōu)化問題,需平衡實時性與泛化性。

2、系統(tǒng)工程化落地:實現(xiàn)大規(guī)模訓練/推理框架的高效部署,解決多模塊(感知、決策、執(zhí)行)的端到端協(xié)同及資源調度瓶頸,保障低延遲、高可靠生產級運行。

3、未知場景泛化突破:通過元學習、因果推理等技術提升Agent對未見過業(yè)務場景的快速適應能力,突破數(shù)據(jù)/規(guī)則邊界,需融合領域知識建模與零樣本遷移技術。

技能要求

1、即將取得計算機、應用數(shù)學、統(tǒng)計、人工智能等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、熟悉掌握業(yè)界AIAgent的開發(fā)框架,如LangChain, llamaindex,AutoGen, QwenAgent等其中一種或多種。

備注

相關項目:

1、AI智能體

AI編譯器研發(fā)實習生

工作地點

上海、西安、深圳、北京

工作職責

1、參與AI編譯器的設計與開發(fā),優(yōu)化AI模型在昇騰硬件的編譯與部署效率。

2、研究LLVM、MLIR等編譯器框架,構建高性能算子自動生成、圖優(yōu)化、內存優(yōu)化等技術方案

3、與算法團隊合作設計編譯友好的大模型架構,推動MoE、混合精度訓練等技術的編譯器級支持

4、探索AI與編譯技術的結合方向(如自動并行化、動態(tài)shape優(yōu)化、稀疏計算加速等)

技能要求

1、即將取得計算機/人工智能/電子工程/數(shù)學等相關專業(yè)本科及以上學歷。

2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。

3、深入理解大模型技術棧(Megatron/DeepSpeed/ColossalAI),熟悉LLM訓練/推理的顯存與算力瓶頸。

4、熟悉GPU/昇騰NPU結構,了解LLVM/MLIR/TVM/Triton等AI編譯器經驗者優(yōu)先。

備注

— —