職位描述

職位描述
1.負責模型訓練和效果優化,并訓練模型方法和框架持續迭代優化,包括但不限于seq2seq、gan、diffusion models、多模態生成等研發工作;
2.負責研發下游任務,prompt設計,fine-tuning,模型蒸餾, 可控?本?成,?格和主題控制等;
3.模型支持字節內部智能標注應用場景適配;
4.參與模型的產品落地,包括基于反饋的算法調優、算法創新、系統評測等。
職位要求
1、碩士及以上學歷(優先),具備機器學習/深度學習/計算機視覺/nlp/相關專業知識;
2、優秀的編程能力,精通python/c++,熟悉pytorch分布式訓練;
3、熟悉前沿的神經網絡架構(transformer,vit,clip)并有實際動手經驗,非常熟悉pytorch, huggingface, cuda等技術棧
4、具備深厚的nlp基礎和前沿跟蹤能力,具備模型預訓練,文本生成,多倫對話實戰經驗優先;
5、在內容生成方向有較為深入的研究和探索,富于熱情,自驅力強,勇于進行創新實踐和技術突破
6、關注nlg及多模態生成領域的業界最新動態,如midiourney等。
工作地點
地址:北京朝陽區北京-朝陽區時尚·萬科中心


職位發布者
HR
北京字節跳動網絡技術有限公司


-
互聯網·電子商務
-
1000人以上
-
私營·民營企業
-
北京市海淀區知春路甲48號2號樓10A室