Skip to content

Releases: DeepLink-org/dlinfer

dlinfer release v0.2.3.post2

04 Nov 11:42
4745c92

Choose a tag to compare

  • 支持华为A3
  • 支持华为aclgraph

dlinfer release v0.2.2

09 Sep 08:16
a99f77e

Choose a tag to compare

  • 华为
    • 支持A3上的Qwen系列
    • 修复图模式下的内存泄漏问题
  • 沐曦
    • Refine代码。适配最新软件栈。

dlinfer release v0.2.1.post2

14 Jun 09:48
5a703d6

Choose a tag to compare

华为

  • 多卡下默认使用ray,修复稳定性问题
  • 其他bug fix

v0.1.8

16 Apr 10:18
8784ce6

Choose a tag to compare

华为

  • MoE优化

What's Changed

Full Changelog: v0.1.7...v0.1.8

dlinfer release v0.1.7

16 Apr 10:16
fafa8eb

Choose a tag to compare

华为&沐曦

  • 支持多节点
  • 支持mla,支持dsv2

What's Changed

Full Changelog: v0.1.6...v0.1.7

dlinfer release v0.1.6

26 Feb 09:27
06bc704

Choose a tag to compare

  • performance up on Ascend platform!
    • reaches almost the same performance as MindIE on most dense models with both single and multiple cards.

dlinfer release v0.1.5

22 Jan 13:47
dbb1feb

Choose a tag to compare

  • 华为,沐曦,寒武纪上均支持InternLM3-8B
  • 沐曦
    • 支持cudagraph
  • 寒武纪
    • 完成代码合并,支持InternLM/InternVL/LLaMA/Qwen(VL)系列/Mixtral8x7B

dlinfer release v0.1.3.post1

11 Dec 06:33
df4f81b

Choose a tag to compare

  • 华为

    • 支持int8的kv cache
    • 修复w4a16方面的bug
  • 沐曦

    • 支持w4a16
    • 支持多种数据排布的Linear计算
    • 支持最新沐曦软件栈
    • 修复多轮对话

dlinfer release v0.1.2

18 Nov 08:58
a3f3be3

Choose a tag to compare

  • 华为
    • support multi-card on graph mode
    • support mistral8x7b on graph mode
    • support more models on eager mode
  • 沐曦
    • code refinement

dlinfer release v0.1.1.post2

28 Oct 14:27
f59dd41

Choose a tag to compare

版本

v0.1.1.post2

更新内容

  1. 支持沐曦C500加速卡
  2. 支持华为图模式(llama3-8B/llama2-7B/Qwen2-7B)
  3. 华为支持W4A16量化与推理
  4. 其他华为与沐曦平台优化