不要再做涼皮炒奶茶了,在你成為“大廚”之前,比你優(yōu)秀的人還在偷偷學(xué)習(xí)。本文將推薦9大在線課程,如果你對(duì)數(shù)據(jù)科學(xué)感興趣,一定不要錯(cuò)過(guò)。
未來(lái)幾年,市場(chǎng)對(duì)于“紙上數(shù)據(jù)科學(xué)家”(指代那些沒(méi)有正式資格、但具有在日常工作分析數(shù)據(jù)的技能和知識(shí)的人)的需求將超過(guò)對(duì)傳統(tǒng)數(shù)據(jù)科學(xué)家的需求。
這意味著,幾乎任何人都可以通過(guò)學(xué)習(xí)數(shù)據(jù)科學(xué)基本理論和實(shí)踐技能來(lái)提升自己的就業(yè)能力和職業(yè)前景。幸運(yùn)的是,網(wǎng)上有大量資源可以幫助你做到這一點(diǎn)。
下面我將推薦其中一些課程。如果你在完成課程之后獲得正式證書(shū)或者證明,有些可能是需要付費(fèi)的。但是,學(xué)習(xí)資料面向想要提高數(shù)據(jù)知識(shí)和技能的任何人都是免費(fèi)的。
1. Data Science Crash Course, John Hopkins University (Coursera)
學(xué)習(xí)地址:https://www.classcentral.com/course/data-science-crash-course-4392
該課程旨在告訴你數(shù)據(jù)科學(xué)是什么、原理是什么、可以用來(lái)做什么。課程介紹了數(shù)據(jù)科學(xué)技術(shù),主要目的是讓需要管理數(shù)據(jù)科學(xué)家或者數(shù)據(jù)科學(xué)人員的人了解“全局”。
這是一門(mén)相對(duì)較短的課程,僅包含一個(gè)模塊,可以在一周之內(nèi)完成,對(duì)于那些想要學(xué)習(xí)術(shù)語(yǔ)并了解如何構(gòu)建數(shù)據(jù)科學(xué)策略而不必詳細(xì)說(shuō)明其中涉及的技術(shù)工具的人來(lái)說(shuō),是一個(gè)很好的入門(mén)選擇。
2. Introduction to Data Science (Revised) - Alison
學(xué)習(xí)地址:https://alison.com/course/introduction-to-data-science-revised
這個(gè)課程是免費(fèi)的,它將數(shù)據(jù)科學(xué)過(guò)程的核心主題和機(jī)器學(xué)習(xí)入門(mén)分為三個(gè)模塊,每個(gè)模塊大約需要3個(gè)小時(shí)完成,最后會(huì)進(jìn)行評(píng)估。完成所有這些之后,你就可以從其他幾個(gè)類(lèi)似的課程中進(jìn)行選擇,這些課程涵蓋了數(shù)據(jù)編程語(yǔ)言、可視化工具以及諸如建立聚類(lèi)和回歸模型之類(lèi)的技術(shù)。
3. Data Science and Machine Learning Essentials – Microsoft (EdX)
學(xué)習(xí)地址:https://www.classcentral.com/course/edx-data-science-and-mac
該課程針對(duì)那些希望結(jié)合實(shí)踐和理論知識(shí)來(lái)改善職業(yè)前景的人。課程介紹了核心概念和術(shù)語(yǔ),諸如回歸、聚類(lèi)和分類(lèi)之類(lèi)的統(tǒng)計(jì)技術(shù),以及構(gòu)建和評(píng)估模型所需的實(shí)際步驟。
這是微軟提供的課程,課程模塊是基于微軟Azure框架的,但是所講授的概念同樣適用于與AWS等微軟競(jìng)爭(zhēng)對(duì)手的云框架。如果你對(duì)R或Python(數(shù)據(jù)科學(xué)中最常用的兩種編程語(yǔ)言)有基本的了解,那么你可以先考慮涵蓋以下內(nèi)容的其中一門(mén)課程,可能對(duì)你有用。
4. Learn Data Science - Dataquest
學(xué)習(xí)地址:https://www.dataquest.io/?utm_source=learndatasci
雖然Dataquest是一個(gè)提供專(zhuān)有內(nèi)容的付費(fèi)平臺(tái),但Dataquest為所有注冊(cè)用戶(hù)都提供了免費(fèi)的入門(mén)模塊,涵蓋了如使用數(shù)據(jù)、可視化數(shù)據(jù)、挖掘數(shù)據(jù)、在Python和R中構(gòu)造算法等基本主題。如果你想獲得完整的、無(wú)廣告的使用體驗(yàn)及認(rèn)證,那么你可以選擇每月訂閱的方式,但事實(shí)上,免費(fèi)版本就可以讓你獲得足夠多的信息。
5. Data Science - Harvard
學(xué)習(xí)地址:http://cs109.github.io/2015/pages/videos.html
哈佛大學(xué)的這個(gè)數(shù)據(jù)科學(xué)課程所提供的所有課程材料和講座都是可以在線免費(fèi)獲得的,因此你可以按照自己的進(jìn)度來(lái)學(xué)習(xí)。你可能沒(méi)有獲得過(guò)這所全球最負(fù)盛名的大學(xué)的學(xué)位,但是這個(gè)課程足夠詳細(xì)、足夠技術(shù),能讓你變身專(zhuān)家。該課程是數(shù)據(jù)科學(xué)學(xué)位學(xué)習(xí)內(nèi)容的一部分,主要面向那些對(duì)編程、數(shù)學(xué)和統(tǒng)計(jì)學(xué)等核心領(lǐng)域有一定知識(shí)儲(chǔ)備或者正在學(xué)習(xí)的學(xué)生。但是,這些主題有足夠的免費(fèi)資源,對(duì)于學(xué)術(shù)界以外的人來(lái)說(shuō),這是一個(gè)不錯(cuò)的選擇。
6. Introduction to Data Science in Python – University of Michigan (Coursera)
學(xué)習(xí)地址:https://www.coursera.org/learn/python-data-analysis?ranMID=40328&ranEAID=SAyYsTvLiGQ&ranSiteID=SAyYsTvLiGQ-Bfo4LFjaYn4mTYUpc2eISQ&siteID=SAyYsTvLiGQ-Bfo4LFjaYn4mTYUpc2eISQ&utm_content=10&utm_medium=partners&utm_source=linkshare&utm_campaign=SAyYsTvLiGQ
想學(xué)習(xí)編程的人都知道,Python是該領(lǐng)域最常用的編程語(yǔ)言之一。這是有原因的,Python的基礎(chǔ)知識(shí)相對(duì)簡(jiǎn)單,而且可以結(jié)合很多免費(fèi)的開(kāi)放源代碼庫(kù)使用,執(zhí)行功能強(qiáng)大的數(shù)據(jù)科學(xué)操作。
該課程就是學(xué)習(xí)Python語(yǔ)言的第一步,主要介紹了用于準(zhǔn)備和操作大型數(shù)據(jù)集的Python函數(shù),以及從數(shù)據(jù)中提取見(jiàn)解的成熟技術(shù)。該課程預(yù)計(jì)需要4周時(shí)間完成,每周需要3到6個(gè)小時(shí)。
7. Learn Data Science with R – Ram Reddy (Coursera)
學(xué)習(xí)地址:https://www.udemy.com/course/datascience_with_r/
該課程是由一位經(jīng)驗(yàn)豐富的R和數(shù)據(jù)分析專(zhuān)家主講的,是有關(guān)專(zhuān)業(yè)R編程10個(gè)篇章中的第一篇,但也是獨(dú)立一篇,是R語(yǔ)言的入門(mén)基礎(chǔ),與數(shù)據(jù)科學(xué)有關(guān)。
與Python一樣,R是一種完全免費(fèi)的開(kāi)源語(yǔ)言和環(huán)境,由于其強(qiáng)大的功能和靈活性,R已成為數(shù)據(jù)科學(xué)家公認(rèn)的標(biāo)準(zhǔn)。
本課程包含10個(gè)講座,涉及8個(gè)小時(shí)的視頻,完全免費(fèi)的。
8. Introduction to Data Science Using Python - Rakesh Gopalakrishnan (Udemy)
學(xué)習(xí)地址:https://www.udemy.com/course/introduction-to-data-science-using-python/
這是Udemy關(guān)于Python數(shù)據(jù)科學(xué)和編程入門(mén)課程中評(píng)價(jià)最高的課程之一。該課程從基礎(chǔ)開(kāi)始,不需要具備任何先前的知識(shí)或者經(jīng)驗(yàn)。但是,與其他一些入門(mén)級(jí)課程不同的是,它有一些使用Python的實(shí)踐指導(dǎo),其中Sci-Kit Learn框架特別有用,這是一種非常流行的學(xué)術(shù)級(jí)和企業(yè)級(jí)數(shù)據(jù)探索和挖掘工具。
9. I Heart Stats: Learning to Love Statistics – University of Notre Dame (EdX)
學(xué)習(xí)地址:https://www.classcentral.com/course/edx-i-heart-stats-learning-to-love-statistics-3048
與數(shù)學(xué)和計(jì)算機(jī)科學(xué)一樣,統(tǒng)計(jì)學(xué)是那些從事數(shù)據(jù)科學(xué)和分析項(xiàng)目的人要學(xué)習(xí)的基本學(xué)術(shù)學(xué)科之一。如果你是個(gè)新手,那么該課程將提供非技術(shù)的基礎(chǔ)知識(shí),涵蓋基礎(chǔ)知識(shí)和一些高級(jí)原理和技術(shù),幫助那些想要在數(shù)據(jù)科學(xué)領(lǐng)域站穩(wěn)腳跟的人。
如果你想真正地理解數(shù)據(jù)科學(xué),那么你會(huì)在某個(gè)時(shí)候遇到統(tǒng)計(jì)和概率問(wèn)題,這肯定會(huì)讓新手很困惑,特別是當(dāng)你已經(jīng)從大學(xué)畢業(yè)有一段時(shí)間,所學(xué)知識(shí)也記得不那么清楚了。所以,該課程介紹了如何使用統(tǒng)計(jì)方法來(lái)利用我們周邊的一切信息。
潛心修煉,不斷學(xué)習(xí)。期待疫情過(guò)后,每個(gè)人都能遇見(jiàn)不一樣的自己。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。