相关文章
大语言模型推理加速技术:模型压缩篇
原文:大语言模型推理加速技术:模型压缩篇 - 知乎
目录
简介
量化(Quantization)
LLM.int8()
GPTQ
SmoothQuant
AWQ
精简Attention
共享Attention参数
Multi-Query Attention
Grouped-Query Attention
稀疏Attention
Sliding Window Attenti…
建站知识
2025/5/10 12:22:50
autocrlf和safecrlf
git远程拉取及提交代码,windows和linux平台换行符转换问题,用以下两行命令进行配置:
git config --global core.autocrlf false
git config --global core.safecrlf true CRLF是windows平台下的换行符,LF是linux平台下的换行符。…
建站知识
2025/5/20 13:42:49
c# Excel转换成DataSet
/// <summary> /// Excel转换成DataSet(.xlsx/.xls) /// </summary> /// <param name"filePath">Excel文件路径</param> /// <param name"strMsg"></param> …
建站知识
2025/5/20 13:14:43
Maya笔记 设置工作目录
Maya会把素材场景等自动保存在工作目录里,我们可以自己定义工作目录
步骤1 创建workspace.mel文件
文件/设置项目 ——>选择一个文件夹,点击设置——>创建默认工作区 这一个后,可以在文件夹里看到.mel文件
步骤2 自动创建文件夹…
建站知识
2025/5/15 14:41:36
模拟算法题练习(一)
模拟算法介绍:
模拟算法通过模拟实际情况来解决问题,一般容易理解但是实现起来比较复杂,有很多需要注意的细节,或者是一些所谓很“麻模“的东西。
模拟题一般不涉及太难的算法,一般就是由较多的简单但是不好处理的部…
建站知识
2025/5/16 21:48:46
《山雨欲来-知道创宇 2023 年度 APT 威胁分析总结报告》
下载链接: https://pan.baidu.com/s/1eaIOyTk12d9mcuqDGzMYYQ?pwdzdcy
提取码: zdcy
建站知识
2025/5/17 20:45:05