前言
学习笔记目录,包含论文笔记.
操作系统:Windows 11 家庭中文版
论文学习笔记
- 00122 神经语言模型的缩放定律 (论文学习笔记): 神经语言模型的缩放定律(2020).
- 00123 零冗余优化器 论文学习笔记: 零冗余优化器(2020).
- 00124 MiniCPM 论文学习笔记: MiniCPM 小型的语言模型(2024).
- 00125 Phi-3 论文学习笔记: Phi-3 小型的语言模型(2024).
- 00168 ChatGLM 论文学习笔记: ChatGLM 语言模型(2024).
人工智能
- 00258 混淆矩阵: 混淆矩阵.
- 00262 roc_auc_score 函数: roc_auc_score 函数.
- 00253 Monte Carlo Tree Search算法: Monte Carlo Tree Search算法.
杂项
人工智能
- 00032-人工智能杂项: 介绍一些人工智能杂项,包括:激活函数等问题.
- 00077-PyTorch 杂项: 介绍一些 PyTorch 杂项.
- 00079-Hugging Face 杂项: 介绍一些 Hugging Face 的杂项.
编程语言
- 00030-Python 杂项: 介绍一些 Python 杂项,包括:Python 语法等问题.
- 00069-简洁 C/C++ 杂项: 介绍一些 C/C++ 简洁技巧.
- 00038-Markdown 杂项: 介绍一些 Markdown 杂项.
- 00154 Verilog 杂项: 介绍一些 Verilog 的杂项.
python 库
- 00092-pandas 杂项: 介绍一些 pandas 杂项.
- 00068 Sphinx 杂项: 介绍一些 Sphinx 杂项.
- 00070-pybind11 杂项: 介绍一些 pybind11 杂项,包括:打包等问题.
- 00207 Python 常用包安装笔记: Python 常用包安装笔记.
编程环境
- 00028-Linux 杂项: 介绍一些 Linux 杂项,包括:Linux 命令、Linux 系统问题.
- 00058-Windows 杂项: 介绍一些 Windows 杂项,包括:Windows 系统问题.
- 00145 VSCode 杂项: 介绍一些 VSCode 杂项.
- 00065-Git 杂项: 介绍 Git 和 Github 的杂项.
- 00172 Node.js 杂项: 介绍一些 Node.js 杂项.
文档
- 00061-WPS 杂项: 介绍一些 Office 办公软件杂项,包括:Word、Excel、PPT 问题.
编程语言
Python
- 00084 Python 类: Python 类学习笔记.
- 00083 Python 装饰器: Python 装饰器学习笔记.
- 00086 Python property 装饰器: Python property 装饰器学习笔记.
- 00261 Python hash 方法: Python
__hash__
方法. - 00267 Python chain函数: chain函数.
- 00237 partial 函数: partial 函数.
- 00269 Python MethodType 方法: Python MethodType 方法.
- 00260 Python UUID 函数: UUID 函数.
- 00244 inspect.signature 函数: inspect.signature 函数.
- 00259 Python 堆队列算法: Python 堆队列算法.
- 00265 difflib — 计算差异的辅助工具: difflib — 计算差异的辅助工具.
- 00085 Python 垃圾回收器接口: Python 垃圾回收器接口学习笔记.
- 00175 warnings 学习笔记: warnings — 警告信息控制.
- 00089 Python dataclasses — 数据类: dataclasses — 数据类学习笔记.
- 00091 Python typing —— 对类型提示的支持: typing —— 对类型提示的支持学习笔记.
- 00016 ctypes — Python 的外部函数库: 介绍 ctypes — Python 的外部函数库.
- 00120 Python 日期和时间: Python 日期和时间.
- 00239 subprocess.run 用法: subprocess.run 用法.
- 00164 Python concurrent 包 学习笔记: concurrent.futures — 启动并行任务.
- 00054 copy 标准库学习笔记: copy — 浅层 (shallow) 和深层 (deep) 复制操作.
- 00055 CSV 文件读写: CSV 文件读写.
- 00093 Python json — JSON 编码和解码器: Python json — JSON 编码和解码器学习笔记.
- 00169 argparse 学习笔记, 00048 Argparse 教程学习笔记: argparse — 用于命令行选项、参数和子命令的解析器.
- 00047 正则表达式 HOWTO 学习笔记: 关于在 Python 中通过 re 模块使用正则表达式的官方入门教程.
- 00063 使用pip和虚拟环境安装包: 使用pip和虚拟环境安装包.
- 00235 pip查看包的位置: pip查看包的位置.
- 00046 打包 Python 项目: 打包 Python 项目.
- 00080 logging — Python 的日志记录工具: Python 的日志记录工具.
- 00166 PEP 8 – Style Guide for Python Code: PEP 8-Python代码样式指南.
- 00167 在VS Code中格式化Python: 在VS Code中格式化Python
- 00148 Python Fire 学习笔记: Python Fire是一个库,用于从绝对任何Python对象自动生成命令行界面(CLI).
- 00255 Python 实用自定义便利函数: Python 实用自定义便利函数.
C++
- 00246 ubuntu安装常见的c++环境: ubuntu安装常见的c++环境.
Verilog
- 00158 Verilog In One Day 学习笔记: Verilog In One Day.
LaTex
- 00114 初识 LaTeX: 初识 LaTex,主要集中于基础语法知识.
- 00115 利用 LaTeX 做 PPT (Beamer): 基于 Beamer,利用 LaTex 做 PPT.
- 00116 Beamer 主题: 介绍一些 Beamer 主题.
- 00118 本地配置 LaTeX 环境-windows11: 利用 VSCode 在本地配置 LaTex 编译环境.
Linux 命令
- 00228 tgz文件解压缩: tgz文件解压缩.
- 00238 cp命令: cp命令.
- 00229 linux如何看cpu数: linux如何看cpu数.
- 00234 Shell脚本入门笔记: Shell脚本入门笔记.
- 00247 ubuntu内存查看方法: ubuntu内存查看方法.
- 00268 linux查看操作系统的命令: linux查看操作系统的命令.
- 00257 tmux 入门学习笔记: tmux 入门学习笔记.
Hugging Face
- 00202 Hugging Face 常用函数: 常用函数.
datasets
- 00170 了解您的数据集: 了解您的数据集.
- 00195 创建数据集: 创建数据集.
- 00196 加载文本数据: 加载文本数据.
- 00264 处理文本数据: 处理文本数据.
trl
- 00176 使用 trl 进行 sft: 此脚本展示了如何使用SFTTrainer将模型或适配器微调到目标数据集中.
- 00189 TRL - Supervised Fine-tuning Trainer: 介绍监督微调训练器.
教程
- 00147 预处理数据: 预处理数据.
- 00126 微调预训练模型: 微调预训练模型.
- 00127 🤗 加速分布式训练: 🤗 加速分布式训练.
- 00128 使用 🤗 PEFT 加载adapters: 使用 🤗 PEFT加载adapters.
指南
- 00142 共享自定义模型: 共享自定义模型.
- 00143 文本生成策略: 文本生成策略.
任务
- 00129 文本分类: 文本分类.
- 00130 Token 分类: Token 分类.
- 00131 问答: 问答.
- 00132 因果语言建模: 因果语言建模.
- 00133 掩码语言建模: 掩码语言建模.
- 00134 翻译: 翻译.
性能和可扩展性
训练
- 00135 性能与可扩展性: 性能与可扩展性.
- 00136 在单个GPU上进行高效训练的方法和工具: 在单个GPU上进行高效训练的方法.
- 00137 在多个GPU上进行高效训练: 在多个GPU上进行高效训练的方法.
- 00138 完全分片数据并行: 完全分片数据并行.
- 00139 DeepSpeed: DeepSpeed.
推理
- 00140 CPU 推理: CPU推理.
- 00141 GPU 推理: GPU推理.
博客
- 00144 ChatGPT 背后的“功臣”——RLHF 技术详解: ChatGPT 背后的“功臣”——RLHF 技术详解.
- 00160 PEFT:在低资源硬件上对十亿规模模型进行参数高效微调: PEFT.
- 00152 “StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程: 用 RLHF 训练 LLaMA 的手把手教程.
- 00150 使用 DPO 微调 Llama 2: 使用 DPO 微调 Llama 2.
- 00162 大规模 Transformer 模型 8 比特矩阵乘简介: 大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsandbytes.
- 00151 面向生产的 LLM 优化: 面向生产的 LLM 优化.
- 00161 How to generate text: using different decoding methods for language generation with Transformers: 通过 Transformers 用不同的解码方法生成文本.
- 00153 开源大语言模型作为 LangChain 智能体: 开源大语言模型作为 LangChain 智能体.
- 00146 Cheat Sheet: Mastering Temperature and Top_p in ChatGPT API: 掌握ChatGPTAPI中的温度和Top_p.
NLP Course
1. Transformer models
- 00174 NLP Course - Introduction: Introduction.
- 00178 NLP Course - Natural Language Processing: Natural Language Processing.
- 00179 NLP Course - Transformers, what can they do?: Transformers, what can they do?
- 00180 NLP Course - How do Transformers work?: How do Transformers work?
- 00192 NLP Course - Encoder models: Encoder models.
- 00193 NLP Course - Decoder models: Decoder models.
- 00194 NLP Course - Sequence-to-sequence models: Sequence-to-sequence models.
- 00204 NLP Course - Bias and limitations: Bias and limitations.
- 00205 NLP Course - Summary: Summary.
2. Using 🤗 Transformers
- 00208 NLP Course - Introduction: Introduction.
- 00209 NLP Course - Behind the pipeline: Behind the pipeline.
- 00210 NLP Course - Models: Models.
- 00211 NLP Course - Tokenizers: Tokenizers.
- 00212 NLP Course - Handling multiple sequences: Handling multiple sequences.
- 00213 NLP Course - Putting it all together: Putting it all together.
- 00214 NLP Course - Basic usage completed!: Basic usage completed!
3. Fine-tuning a pretrained model
- 00215 NLP Course - Introduction: Introduction.
- 00216 NLP Course - Processing the data: Processing the data.
- 00217 NLP Course - Fine-tuning a model with the Trainer API: Fine-tuning a model with the Trainer API.
- 00218 NLP Course - A full training: A full training.
- 00219 NLP Course - Fine-tuning, Check!: Fine-tuning, Check!
4. Sharing models and tokenizers
- 00220 NLP Course - The Hugging Face Hub: The Hugging Face Hub.
- 00221 NLP Course - Using pretrained models: Using pretrained models.
- 00222 NLP Course - Sharing pretrained models: Sharing pretrained models.
- 00223 NLP Course - Building a model card: Building a model card.
- 00224 NLP Course - Part 1 completed!: Part 1 completed!.
5. The 🤗 Datasets library
- 00225 NLP Course - Introduction: Introduction.
- 00226 NLP Course - What if my dataset isn’t on the Hub?: What if my dataset isn’t on the Hub?.
- 00227 NLP Course - Time to slice and dice: Time to slice and dice.
- 00240 NLP Course - Big data? 🤗 Datasets to the rescue!: Big data? 🤗 Datasets to the rescue!
- 00241 NLP Course - Creating your own dataset: Creating your own dataset.
- 00243 NLP Course - Semantic search with FAISS: Semantic search with FAISS.
- 00249 NLP Course - 🤗 Datasets, check!: 🤗 Datasets, check!
6. The 🤗 Tokenizers library
- 00250 NLP Course - Introduction: Introduction.
- 00251 NLP Course - Training a new tokenizer from an old one: Training a new tokenizer from an old one.
- 00252 NLP Course - Fast tokenizers’ special powers: Fast tokenizers’ special powers.
- 00254 NLP Course - Fast tokenizers in the QA pipeline: Fast tokenizers in the QA pipeline.
- 00263 NLP Course - Normalization and pre-tokenization: Normalization and pre-tokenization.
Hugging Face Llama Recipes
- 00198 Hugging Face Llama Recipes - Getting Started: Getting Started.
- 00199 Hugging Face Llama Recipes - Local Inference: Local Inference.
- 00201 Hugging Face Llama Recipes - Fine Tuning: Fine Tuning.
PyTorch
- 00200 PyTorch - 常用函数: PyTorch - 常用函数.
- 00149 Fully Sharded Data Parallel(FSDP) 学习笔记: Fully Sharded Data Parallel(FSDP) 学习笔记.
大模型提供商
- 00171 OpenAI 文档: OpenAI 文档.
- 00242 vLLM 学习笔记: vLLM是一个快速且易于使用的LLM推理和服务库.
- 00233 Qwen2.5-Coder: Qwen2.5-Coder 全系列,强大、多样、实用.
- 00236 QwQ-32B-Preview: QwQ, 思忖未知之界.
Ollama
- 00230 Ollama 学习笔记: Get up and running with large language models.
- 00231 Ollama 学习笔记 (手动安装): Manual install.
- 00232 Ollama Python Library: Ollama Python Library.
Git
- 00117 Github 主页设置贪吃蛇详细教程: 如何在 Github 主页上设置贪吃蛇.
- 00119 常用的 GitHub Workflows: 常用的 GitHub Workflows.
- 00177 使用 Gitea 自建 Git 服务: 使用 Gitea 自建 Git 服务.
- 00191 在 wsl 上安装 gitea: 在 wsl 上安装 gitea.
- 00245 新建git仓库: 新建git仓库.
- 00256 ping 不通 Github: ping 不通 Github.
Linux & Windows
- 00163 如何使用WSL在Windows上安装Linux: 如何使用WSL在Windows上安装Linux.
- 00190 U盘作为系统启动盘后如何恢复: U盘作为系统启动盘后如何恢复.
- 00173 Docker 文档: Docker 文档.
画图
- 00203 Plotly - Violin: 如何在Python中使用Plotly制作小提琴图.
求学时的岁月
- 00094-读的论文清单:读研时阅读过的论文.
结语
第一百二十一篇博文写完,开心!!!!
今天,也是充满希望的一天。