导航:首页 > 数据处理 > 南京大学怎么用python数据

南京大学怎么用python数据

发布时间：2025-02-26 13:03:50

㈠ ML system 入坑指南

欢迎进入机器学习系统（ML system）的广阔领域。随着ChatGpt等大模型的兴起，人们愈发关注大模型的实际落地。然而，除了先进的算法，背后支撑的ML system——从分布式训练到高效推理的完整链路同样至关重要。优秀的基础设施是应用爆发的基石。对于刚刚踏入这个领域的“新手”以及对ML system感兴趣但并非该领域背景的其他领域人士，本文将分享个人的学习历程和指引，希望能为你们提供入门和进一步探索的指南。

让我们先从课程入手。学习路径的构建离不开坚实的知识基础。首先，掌握计算机基础，如数据结构，这是必不可少的。接下来，让我们深入探讨更专业性进阶课程：

南京大学JYY老师的操作系统课程：课程内容深入且作业繁重，质量与四大课程相当。

MIT的6.S081操作系统课程：提供全面的资料、实验（lab）以及课程内容。

CMU的15418并行计算课程：介绍现代多处理器、CPU加速、分布式通讯协议、GPU加速（CUDA编程）、异构计算、同步和缓存等核心概念。

UCB的cs267课程：专注于高性能计算（HPC）的原理和应用。

MIT的分布式系统课程：使用Go语言实现，了解传统分布式系统知识和历史对于现代分布式机器学习系统的学习具有一定的帮助，但并非必需。

在课程之外，还有专门针对机器学习系统的课程：

CMU的深度学习系统课程：由陈天奇老师讲授，涵盖神经网络库实现、自动微分、GPU加速、模型部署和AI编译部分内容。课程内容全面，适合有一定基础的学习者阅读或作为参考。

Mini torch：一个用Python实现的简单版本torch，涉及自动微分、张量、GPU加速，适合新手入门。

MIT的Tiny ML课程：针对移动设备和嵌入式系统的课程，感谢@江湖骗子 @Lyken 学长的补充。

此外，还有华为Mindspore团队（我曾在此实习的团队）和一群专家联合推出的课程，涵盖了计算图、编译器前后端、分布式训练等内容，适合有一定基础的学习者阅读或作为工具书使用。微软发起的系统为AI工具书，正在快速迭代更新，补充基础知识。陈天奇老师的AI编译器课程以TVM为基础，是前沿领域的少数课程之一。

对于大型模型的学习，理解最新的算法和模型架构变化是非常必要的，虽然很难有系统的课程，但通过阅读论文、官方网站、博客等资源，可以紧跟业界进展。可以参考李沐老师的论文精讲，关注影响力巨大的工作，如“多就是一切”（Muli is all you need）。

对于大规模分布式训练，目前没有非常系统的课程，但了解分布式训练的基本知识、并行策略和显存优化策略等对于学习者至关重要。这里简单总结了几个关键知识点和参考论文。

编程语言方面，Python是首选，但了解如何调用C（如Cpython、pybind）以及Python高级特性（如hook、装饰器）对于ML sys领域很有帮助。CUDA、OpenCL等并行计算技术也是非Nvidia芯片设备（如手机SoC）上进行异构加速的通用方案。

此外，还有一些工具和框架，如TensorRT、AI Template、Severing Triton-inference-server、clip-as-service、Mobile inference等，涵盖了推理引擎、模型服务等不同方面。对于分布式训练，ColossalAI、Megatron-LM、Deepspeed、huggingface accelerate、Bagua等框架提供了不同层次的支持，帮助解决大规模模型训练中的问题。

最后，对于学习者来说，探索源码、实际案例学习是深入理解ML sys领域知识的绝佳途径。此外，编程语言（如C++、Python）、CUDA、OpenCL等并行计算技术、分布式通讯技术以及大型深度学习框架（如TensorFlow、PyTorch）等都是学习的必备知识。同时，了解AI编译器、模型优化技术、系统设计和实现等方面的知识，对于构建高效、可扩展的机器学习系统至关重要。

阅读全文

与南京大学怎么用python数据相关的资料

热点内容

工行交易卡号如何在app显示发布：2025-02-26 18:03:02 浏览：146

星沙区有哪些职业技术学院发布：2025-02-26 18:02:57 浏览：342

小程序如何做测试发布：2025-02-26 17:58:57 浏览：767

专升本新能源汽车技术哪里好发布：2025-02-26 17:53:19 浏览：293

什么产品能去痣发布：2025-02-26 17:52:05 浏览：999

asp怎么提交页面数据发布：2025-02-26 17:51:25 浏览：123

代理费怎么收合法发布：2025-02-26 17:23:59 浏览：409

熊猫厨房电器代理怎么样发布：2025-02-26 17:08:57 浏览：462

抄股交易有哪些软件发布：2025-02-26 16:51:29 浏览：744

如何发红包的小程序发布：2025-02-26 16:50:46 浏览：907

论文数据怎么收集发布：2025-02-26 16:24:37 浏览：550

数据库如何判断连续几天都有发布：2025-02-26 16:19:52 浏览：400

为什么查不到本年度参保信息发布：2025-02-26 16:05:23 浏览：1002

快餐技术培训哪里学发布：2025-02-26 15:52:34 浏览：391

简易程序反诉费收多少发布：2025-02-26 15:46:37 浏览：763

如何改数据库的字符类型发布：2025-02-26 15:39:18 浏览：568

市场酸豆角怎么处理发布：2025-02-26 15:32:20 浏览：522

微信转帐多久会没信息怎么办发布：2025-02-26 15:12:46 浏览：844

郑州金森女贞苗市场价多少发布：2025-02-26 15:08:17 浏览：949

会计技术资格是什么发布：2025-02-26 14:41:51 浏览：243