相关文章
【大模型实战篇】大模型训练/微调的一些经验分享
1. 概念区分
1.1 预训练 预训练是大模型训练流程的初始阶段,模型通过在大规模语料库上学习,掌握基本的语法规则、逻辑推理能力以及常识知识。目标是使模型具备语言理解能力、逻辑推理能力以及常识知识,可以参考《GPT系列预训练模型原理讲解》…
建站知识
2025/3/5 2:02:57
Python中字符串的类型,作用和常用方法
字符串str
一 打印字符串
字符串拼接
可以使用" , " \ " " \ " "
print("Hello World")print("Hello" , "World")print("Hello" "World")print("Hello" "World")…
建站知识
2025/3/1 12:58:30
隐蔽多客户端上网的 Linux 服务器配置指南
这是一个基于 NAT 转发、流量伪装与安全加固的综合方案。本方案用于共享服务器的互联网连接给局域网内其他机器,但同时希望路由信息不被互联网接入点的防火墙监测到。也就是说,不让防火墙检测到有多个终端连接到互联。
一、核心目标与场景需求
隐蔽性要…
建站知识
2025/3/1 12:56:20
网络流算法: 最大流算法
网络流算法是一类用于解决在流网络中最大化流从源点到汇点问题的算法. 流网络是由节点和有向边构成的图, 每条边有一个容量限制, 表示可以通过该边的最大流量. 网络流问题的目标是找到一种流分配方式, 使得整个网络从源到汇的总流量最大.
在下图中, 节点 0 是源点, 节点 5 是汇…
建站知识
2025/3/1 12:27:35
广义线性模型下的数据分析(R语言)
一、实验目的: 通过上机试验,掌握利用R实现线性回归分析、逻辑回归、列联分析及方差分析,并能对分析结果进行解读。
数据: 链接: https://pan.baidu.com/s/1JqZ_KbZJEk-pqSUWKwOFEw 提取码: hxts
二、实验内容: 1、2…
建站知识
2025/3/1 12:12:45
北京大学DeepSeek提示词工程与落地场景(PDF无套路免费下载)
近年来,大模型技术飞速发展,但许多用户发现:即使使用同一款 AI 工具,效果也可能天差地别——有人能用 AI 快速生成精准方案,有人却只能得到笼统回答。这背后的关键差异,在于提示词工程的应用能力。
北京大…
建站知识
2025/3/1 12:10:22