AI-Book

zhongqiao yuan a4ba7b27b0 Update ml-alg.md 2 meses atrás
Embodied 049a4fa709 Yuan 3 meses atrás
applications 049a4fa709 Yuan 3 meses atrás
cv 24500b1b99 添加目录 1 ano atrás
management eb8cf2787f Add new file 1 ano atrás
ml 435135b4f3 Update deeplearning.md 4 meses atrás
nlp 46067d2bbf Add new file 1 ano atrás
robot d0882a9e2f Update rootai.md 2 meses atrás
Embodied.md b548e61852 Update Embodied.md 1 ano atrás
NLP+BERT.md 9c2ef9434c Update NLP+BERT.md 1 ano atrás
PyTorch.md 232da3e61f Update PyTorch.md 1 ano atrás
README.md 286b68821f Update README.md 4 meses atrás
TensorFlow.md 505c0e7533 Update TensorFlow.md 4 meses atrás
Transfer.md a5cce4cf40 Update Transfer.md 1 ano atrás
ai-book-ml.md 335d599826 Update ai-book-ml.md 2 meses atrás
auto-drive.md ff9688f329 Update auto-drive.md 1 ano atrás
cv.md 5657c8e757 Update cv.md 2 meses atrás
ml-alg.md a4ba7b27b0 Update ml-alg.md 2 meses atrás

README.md

AI-Book

学习计划

学习人工智能是一个系统而深入的过程,涉及数学基础、编程技能、机器学习、深度学习等多个领域。以下是一个为期大约一年的学习计划,旨在帮助你逐步构建起人工智能领域的知识体系:

第1-2个月:基础准备

目标:

  • 掌握必要的数学基础。
  • 学习一门编程语言。

学习内容:

  1. 数学基础

    • 线性代数:向量、矩阵、线性变换、特征值与特征向量等。
    • 概率论与统计学:概率分布、条件概率、贝叶斯定理、随机变量、期望与方差、常见统计分布等。
    • 微积分:导数、偏导数、梯度、链式法则、积分等。
    • 优化理论:梯度下降、牛顿法等。
  2. 编程技能

    • 学习Python,因为它在AI领域广泛应用。
    • 掌握基本语法、数据结构(列表、字典、集合)、控制流、函数、模块等。
    • 学习使用NumPy进行数值计算,Pandas处理数据。

第3-4个月:机器学习入门

目标:

  • 理解机器学习基本概念。

机器学习基础知识

  • 掌握几种经典机器学习算法。

学习内容:

  1. 机器学习基础

    • 监督学习、无监督学习、强化学习基本概念。
    • 评估指标:准确率、精确率、召回率、F1分数、ROC曲线等。
    • 过拟合与欠拟合,交叉验证。
  2. 经典算法

    • 线性回归、逻辑回归。
    • 决策树、随机森林、梯度提升树。
    • 支持向量机、朴素贝叶斯。
    • K-近邻、K-均值聚类。

机器学习算法进行公式推导、问题分析以及代码实现

经典机器学习算法

  1. 实践

    • 在gitpp上反复浏览大量AI项目
    • 使用scikit-learn库实现上述算法。
    • 参与Kaggle竞赛或完成一些小项目,如分类、回归任务。

第5-6个月:深度学习基础

目标:

  • 理解神经网络原理。
  • 掌握深度学习框架。

深度学习入门手册

利用平台、框架、API 快速开发应用

打工者,牛马的看家本领:利用平台、框架、API 快速开发应用

利用平台、框架、API 快速开发应用

学习内容:

  1. 神经网络基础

    • 神经元、层、前馈神经网络。
    • 激活函数、损失函数、优化算法。
    • 反向传播算法。
  2. 深度学习框架

    • 学习TensorFlow或PyTorch,理解其核心概念。
    • 使用框架构建和训练简单的神经网络。

实战TensorFlow

实战PyTorch

  1. 实践

    • 实现多层感知机(MLP)进行图像分类或文本分类。
    • 了解卷积神经网络(CNN)和循环神经网络(RNN)的基本原理。
  2. 高级框架

面向Java的人工智能框架 Java语言的机器学习所有算法 这之前学习JAVA的一切 JAVA的一切

scikit-learn Python 中的机器学习

第7-8个月:深入深度学习

目标:

  • 深入理解复杂网络结构。
  • 掌握自然语言处理和计算机视觉的基础。

学习内容:

  1. 高级网络结构

    • 卷积神经网络(CNN):LeNet、AlexNet、VGG、ResNet等。
    • 循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)。
    • 生成对抗网络(GAN)、变分自编码器(VAE)。
  2. 应用领域

    • 自然语言处理(NLP):词嵌入、RNN/LSTM在NLP中的应用、Transformer模型、BERT等。
    • 计算机视觉(CV):目标检测、图像分割、风格迁移等。

计算机视觉-CV-介绍

视觉在工业领域有大量的应用场景

中国有最全面的工业体系,最好的AI工业的应用场景

工业视觉 低代码AI训练平台 https://mp.weixin.qq.com/s/tMpowP5BS5IegzQFnO_KyQ

  1. 实践
    • 使用深度学习框架实现上述网络。
    • 参与更复杂的项目,如图像识别、文本生成等。

GPP 开源 yolo anything yolo框架 https://www.gitcc.com/dacoman/yolo-anything

  1. 工业实践
    • 布匹检测
    • 工业元器件检测
    • 钢材表面结构检测
    • 字符识别

大模型支持的视频监控 https://mp.weixin.qq.com/s/7MJ-zaxP5Cb4AMKwiHIyJw

  1. 安全实践
    • 气体检测
    • 火灾检测

Gpp开源 YOLO anything 目标是通用检测框架 https://www.gitcc.com/dacoman/yolo-anything

立刻 马上 全面 拥抱 DeepSeek

立刻 马上 全面 拥抱 DeepSeek

重点推荐

中文的 AI-LLM 大模型入门项目

  1. 机器人
    • 机器人介绍
    • 具身智能

机器人和人工智能

机器人向着具身智能快速发展,最近几年的热点

具身智能

机器人操作系统,下一个万亿级别的机会

北大、哈佛、斯坦福发起的Open Embodied项目 https://github.com/open-embodied

一站式机器人开发环境

ROS2 + Gazebo + PX4 + AI Docker 环境 完整的开发容器 一站式机器人开发环境

第9-12个月:进阶与实践

目标:

  • 跟进最新研究进展。
  • 完成综合项目,提升实战能力。
  • 在Kaggle上打比赛赚美金

Kaggle竞赛是一个全球知名的数据科学和机器学习竞赛平台,由Google收购,吸引了全球数据科学家和机器学习爱好者参与。参赛者通过解决企业发布的实际问题,提升技能并有机会赢取高额奖金。Kaggle竞赛是提升个人背景、助力申请名校和求职的绝佳途径。

Kaggle竞赛 真实题目

可视化您的AI模型

看看AI模型长什么鸭子

通过了解真实的开源项目,了解AI产品的方向

深入方向

NLP和大语言模型

深入RAG技术

学习内容:

  1. 研究前沿
    • 阅读最新论文,了解AI领域的最新进展,如自监督学习、迁移学习、联邦学习等。
    • 关注GitPP上的AI开源项目和社区,参与讨论。

迁移学习 联邦学习:让数据可用不可见

  1. 综合项目
    • 选择一个感兴趣的领域(如智能推荐系统、自动驾驶、医疗影像识别等),从数据收集、预处理到模型设计、训练、部署,全程参与。
    • 尝试复现一些经典的或最新的研究成果。

推荐系统

知识图谱

  1. 软技能
    • 提升论文阅读和写作能力。
    • 学习如何有效沟通和展示研究成果。

学习资源建议:

  • 在线课程:Coursera、网易云课堂、B站上有许多优质的AI课程。
  • 书籍:《深度学习》、《机器学习实战》、《Python编程:从入门到实践》等。
  • 论文:arXiv、Google Scholar是获取最新研究论文的好去处。
  • 社区:GitHub、Reddit的r/MachineLearning、Kaggle等,可以参与讨论,获取灵感。

记得在学习过程中不断实践,理论与实践相结合才能更有效地吸收知识。同时,保持好奇心和持续学习的态度,人工智能领域日新月异,终身学习是必经之路。

#知识集合 干项目,干中学

智能推荐系统、自动驾驶、医疗影像识别

普通人职业生涯到此已经截至了!

做开源 新的开源协议

中国人的开源协议 中国人的开源协议

程序员的身体护养 放前头

程序员的养生

如果没有超强的执行力,对职业生涯的规划,很可能到此为止

看项目

1)AI 驱动的云原生运维平台 AI 驱动的云原生运维平台

要在三五年之内掌握这些,职场就足够了。但是要想在职场更上一层楼,就必须广泛的观察,深度的思考,快速的学习和反复的实践

广泛的观察,深度的思考,快速的学习和反复的实践

先把GPT的源代码啃了!

啃源代码

敢不敢啃源代码?想不想年薪百万?啃!

GPT的源代码!啃!

架构师 思考全流程 年薪百万级别

1)GPU算力调度

一种任务级GPU算力分时调度的高性能深度学习训练平台

2)底层优化 能看懂下面题目的,年薪百万

一个简单易用,低门槛的自动算子优化工具,提高深度学习算法部署效率。 自动算子优化工具,提高深度学习算法部署效率

3)专注于张量计算/深度学习的基础库 能理解这个题目的,年薪百万

专注于张量计算/深度学习的基础库

AI负责人 思考全盘 年薪两百万起

1)企业级AI平台的建设 AI平台

2)从产业角度出发思考 比如物联网+AI 带有人工智能的物联网系统

3)AI对产业的影响和加速 AI药物发现平台

关注AI产品,锻炼自己的产品提炼能力

一:产品力

1) Agent 项目大爆发

本地化RAG :一个由本地大型语言模型(LLM)提供支持、用于网络浏览的检索增强生成(RAG)大型语言模型(LLM)

本地化RAG

2)RAG

基于向量数据库的知识库管理系统

3) 一站式数据智能体

一站式数据智能体

二:行业的洞察力

下一个GPT在哪里?AI视频

三:个人素养

AI负责人的素养

AI科学家 世界最前沿 年薪千万级别 比如能够提出Transformer模型、能够设计GPT、或者能够做出蛋白质预测模型

这个级别,属于改变世界级别了。 从产品角度再看看TensorFlow、PyTorch这样的框架,本身做为产品,是如何影响世界的。

1) 微软开源 材料大模型

微软开源 材料大模型

2) 人工智能的基础设施

优化高质量的数据集和可视化 AI 模型

3)工业检测大模型

工业检测大模型

4)诺奖- alphafold 开源 -深度学习模型,主要用于蛋白质折叠预测

诺奖- alphafold 开源 -深度学习模型,主要用于蛋白质折叠预测

下面的内容,不光是技术了,还有国际局势、国内环境,个人的天时地利人和,努力以及对时代的把握

君子顺势而为,学技术,修内心,观天下,厚积薄发

年薪千万美金起,能够将公司做到千亿或者万亿,比如AMD的CEO

AMD的CEO苏姿丰是一位杰出的行业领导者,她以卓越的领导力和战略眼光,成功引领AMD实现逆势增长,市值超越长期竞争对手英特尔,并带领公司在人工智能芯片领域取得显著突破,为AMD赢得了全球市场的广泛认可。

随着AI技术的快速发展,对高性能、高算力的硬件需求日益增长。苏姿丰敏锐地洞察到这一趋势,带领AMD积极迎战AI大模型挑战。AMD发布了Instinct MI300X等大模型专用卡,这些产品凭借其出色的性能,受到了Meta、OpenAI和微软等科技巨头的青睐,进一步巩固了AMD在AI芯片领域的地位。

对行业的深度思考,对技术方向的把握,以及在某个方向上的豪赌

芯片产业的未来

天选之人 资产百亿级 创建一家百亿级别千亿级别的公司 比如月之暗面

这个级别是天命之子,比如:

月之暗面的CEO是杨植麟,他是一位在自然语言处理(NLP)领域具有卓越学术成就和丰富创业经验的年轻领导者。月之暗面融资如此之多,主要得益于其强大的技术实力、创新的产品理念以及市场对大模型技术的广泛需求。

杨植麟本科毕业于清华大学,博士毕业于卡内基梅隆大学,是Transformer-XL和XLNet等重要论文的第一作者,这些研究成果在NLP领域产生了深远影响。他带领团队开发了支持超长文本输入的智能助手产品Kimi,满足了市场对大模型技术的迫切需求。

月之暗面凭借其在长文本处理、多模态大模型研发等方面的技术优势,以及清晰的产品定位和商业模式,吸引了众多知名投资机构的青睐,从而获得了巨额融资支持。

创业思考: 还思考啥? 这么多开源的企业应用,找到甲方爸爸,直接卖钱啊!

绝大多数开源协议支持商业化,请遵守开源协议

1000多个企业应用,按照开源协议,可以商业化

夸父 DeepSeek 梁文峰 (跨界之父 称为 夸父 )

跨界之父 梁文峰,本来是做量化的,赚了很多钱,要做点理想主义的事情,纯粹的事情

跨界之父跨界支付了数亿元,也有说是数十亿,买了很多GPU,开始训练,DeepSeek 开源免费,暴击OpenAI,让英伟达一天蒸发3万亿

少有的理想主义者,近几年难得提振了民族的信心,中国人,总要有人站出来,站出来超越美的的

精选数十个DeepSeek开源项目,套壳,疯狂套壳,先搞到10万用户

DeepSeek生态:数十个基于deepSeek的开源工具

立刻 马上 全面 拥抱 DeepSeek

立刻 马上 全面 拥抱 DeepSeek

李大爷

李大爷是国内AI投资最早的,把百度改名狼厂之后,说要有狼性,要All IN AI

但是李大爷总是错过一个又一个机会

当然李大爷还是李大爷,百度的人才厚度和宽度是在的,OpenAI起来的时候,百度应该毅然决然开源,因为大模型实在赚不到钱,还不如开源算了。

可惜李大爷说了那句经典的话: 开源不如闭源。 跨界之父一年后一个耳光,李大爷歇着吧。

IT从业者,要清楚的认识到:开源要远远优于闭源,开源就是受命于天,既寿永昌,没办法,人民群众的力量是无限的。

位面之子 从未来穿越而来,为了解决当下的历史性难题,不留真姓名,功成万里行

注意,位面之子,要比天选之人更牛!

“位面之子”是指被上天特别眷顾的人,通常在科幻或玄幻小说中出现,指的是在一个独立宇宙或维度中赋予特殊意义而诞生的生命‌。这个词汇在网络上广泛传播,用来形容那些运气极好、似乎得到了整个宇宙或位面的帮助的人。‌

难题:

1)HuggingFace 上的人工智能模型,动辄上百G,国内有时候不能访问,即使能够访问,300G的模型,也要下载很久。

怎么办?

2)GitHub上大量的优质项目,凝结了程序员的无差别的劳动,很多都只有几个star,无人问津。

怎么办?

3)全球政府都支持计算机科学家科研,但是全球的计算机科学家,有成果都发表在github上,github是美国的,是微软的

怎么办?

还有,现在这种贸易战局面,美国的网站上不去,怎么办?

卖掉北京的房子,只为中国开源! 每年烧钱,只为存储人类所有的源代码、数据和科研资料!

感谢大家支持,位面之子给你们下跪了,为了中国的开源事业! 一生只干一件事,只为中国存代码!

DeepSeek源代码逐行导读

DeepSeek逐行导读

大模型源代码导读

大模型源代码导读

人工智能的代码阅读神器

大模型集合

大模型集合

开源项目

实战 1

自动驾驶

实战 2

医疗影像识别

实战 3

机器人

参与世界级大项目

真实数据集和真实的问题

属于中国人的开源协议

https://www.gitcc.com/pkuLicense/pku-open-source-license

Installation

no

Usage

README.

Support

Tell people where they can go to for help. It can be any combination of an issue tracker, a chat room, an email address, etc.

Roadmap

想到哪里写到哪里

Contributing

State if you are open to contributions and what your requirements are for accepting them.

For people who want to make changes to your project, it's helpful to have some documentation on how to get started. Perhaps there is a script that they should run or some environment variables that they need to set. Make these steps explicit. These instructions could also be useful to your future self.

You can also document commands to lint the code or run tests. These steps help to ensure high code quality and reduce the likelihood that the changes inadvertently break something. Having instructions for running tests is especially helpful if it requires external setup, such as starting a Selenium server for testing in a browser.

Authors and acknowledgment

Show your appreciation to those who have contributed to the project.

License

For open source projects, say how it is licensed.

Project status

If you have run out of energy or time for your project, put a note at the top of the README saying that development has slowed down or stopped completely. Someone may choose to fork your project or volunteer to step in as a maintainer or owner, allowing your project to keep going. You can also make an explicit request for maintainers.