相关文章
大语言模型推理加速技术:模型压缩篇
原文:大语言模型推理加速技术:模型压缩篇 - 知乎
目录
简介
量化(Quantization)
LLM.int8()
GPTQ
SmoothQuant
AWQ
精简Attention
共享Attention参数
Multi-Query Attention
Grouped-Query Attention
稀疏Attention
Sliding Window Attenti…
建站知识
2024/12/28 6:28:18
autocrlf和safecrlf
git远程拉取及提交代码,windows和linux平台换行符转换问题,用以下两行命令进行配置:
git config --global core.autocrlf false
git config --global core.safecrlf true CRLF是windows平台下的换行符,LF是linux平台下的换行符。…
建站知识
2025/1/11 15:39:19
c# Excel转换成DataSet
/// <summary> /// Excel转换成DataSet(.xlsx/.xls) /// </summary> /// <param name"filePath">Excel文件路径</param> /// <param name"strMsg"></param> …
建站知识
2025/1/9 9:57:21
Maya笔记 设置工作目录
Maya会把素材场景等自动保存在工作目录里,我们可以自己定义工作目录
步骤1 创建workspace.mel文件
文件/设置项目 ——>选择一个文件夹,点击设置——>创建默认工作区 这一个后,可以在文件夹里看到.mel文件
步骤2 自动创建文件夹…
建站知识
2025/1/4 13:42:56
模拟算法题练习(一)
模拟算法介绍:
模拟算法通过模拟实际情况来解决问题,一般容易理解但是实现起来比较复杂,有很多需要注意的细节,或者是一些所谓很“麻模“的东西。
模拟题一般不涉及太难的算法,一般就是由较多的简单但是不好处理的部…
建站知识
2025/1/5 9:09:23
《山雨欲来-知道创宇 2023 年度 APT 威胁分析总结报告》
下载链接: https://pan.baidu.com/s/1eaIOyTk12d9mcuqDGzMYYQ?pwdzdcy
提取码: zdcy
建站知识
2025/1/6 10:13:19