2025年6月16日 星期一

O'Reilly 2025 的機器學習、人工智慧與機器人

掌握機器學習

透過 O'Reilly 的專家們提供的完整圖書庫,提升你的程式設計技巧,並建立屬於你自己的機器人。

運用機器學習的強大力量,學習打造數位代理和其它功能,內容包含熱門課程如《學習 LangChain》(Learning LangChain)、《大型語言模型安全開發者手冊》(The Developer's Playbook for Large Language Model Security)、《設計大型語言模型應用程式》(Designing Large Language Model Applications)等。

無論是初學者還是經驗豐富的專業人士,都能利用這些頂級資源來發展你的職業生涯 —— 並透過你的購買來支持 Code for America!

支付 1 ~ 25 美元的費用,獲得 4 ~ 17 項資源
(總價值 1,182 美元)

支付至少 1 美元即可獲得。這套電子書合集的總價通常高達 1,182 美元。而在 Humble Bundle,你可以自由決定支付金額,還可以提升你的貢獻額來升級你的合集!這個合集的最低購買金額為 1 美元。

隨時隨地閱讀。這個合集中的電子書以 PDF、MOBI、ePub 和 PRC 格式提供,因此可以在你的電腦、電子閱讀器、iPad、手機以及多種行動裝置上使用!使用說明及推薦閱讀程式清單可以在 這裡 找到。

支持慈善事業。你可以選擇資金用途 —— 在出版商和支援 codeforamerica 之間進行分配。如果你喜歡,也可以給 Humble 小費!




Code for America 是一家全國性非營利組織,堅信在 21 世紀,政府能夠服務於民、由民而治。組建了一個技術開發網絡,致力於推動地方政府實現創造健康、繁榮和安全社區的優先事項。目標是:為每個人提供簡單、有效率、易用的政府服務。




學習 LangChain

Author: Mayo Oshin, Nuno Campos
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

學習 LangChain

[預覽 PDF]

如果你想建立可投入生產的 AI 應用程式,讓它們能推理並檢索外部資料以達成情境感知,那麼你需要掌握--; 這是一個用於建立、執行和管理代理應用程式的熱門開發框架和平台。 LangChain 已被多家領先公司使用,包括 Zapier、Replit、Databricks 等等。 本指南是理解 Python 或 JavaScript 的開發者不可缺少的資源,特別是針對那些希望運用 AI 強大功能的初學者。

作者 Mayo Oshin 和 Nuno Campos 透過實用見解和深入的教學,揭開 LangChain 的使用秘訣。從基礎概念入門,這本書一步步地教你如何建立一個正式可用的 AI 代理。

  • 運用檢索增強生成(RAG)的力量,透過外部最新資料來提升 LLMs 的準確性
  • 開發和部署具智慧並具有情境互動的 AI 應用程式
  • 使用 LangGraph 的強大代理架構
  • 整合和管理第三方 API 和工具,延伸你的 AI 應用程式的功能
  • 監控、測試以及評估你的 AI 應用程式,以改進效能
  • 了解 LLM 應用程式開發的基礎,以及如何將它們搭配 LangChain 使用

AI 工程

Author: Chip Huyen
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

AI 工程

[預覽 PDF]

AI 的最新突破不僅提升了對 AI 產品的需求,同時也降低了想要打造 AI 產品的人們的入門門檻。 模型即服務的方式將 AI 從一個艱深的學科轉變為任何人都可以使用的強大開發工具。包括那些幾乎沒有 AI 經驗或是完全沒有相關經驗的人,現在也可以利用 AI 模型來建立應用程式。在這本書中,作者 Chip Huyen 討論了 AI 工程:利用現成的基礎模型來建立應用程式的過程。

這本書以 AI 工程的概述開始,解釋了它與傳統機器學習工程的不同,並討論了新的 AI 技術堆疊。AI 的使用越普遍,發生災難性故障的機會也就越高,因此評估的重要性也越加顯著。本書討論了針對開放式模型進行評估的不同方法,包括快速崛起的 AI 擔任裁判的方法。

AI 應用開發者將了解到如何在 AI 相關領域中導航方向,包括模型、資料集、評估基準,以及接近無限的用例和應用模式。你將學到一個開發 AI 應用程式的框架,從簡單的技術入手,再進一步發展到更複雜的方法,並探索如何高效地部署這些應用程式。

  • 了解什麼是 AI 工程,以及它與傳統機器學習工程有何不同
  • 學習開發 AI 應用程式的過程、每個步驟中的挑戰,並了解解決這些挑戰的方法
  • 探索各種模型調整技術,包括提示工程 (prompt engineering)、RAG(Retrieval-Augmented Generation)、微調 (fine-tuning)、代理 (agents)、數據集工程 (dataset engineering),並理解它們的運作方式及原因
  • 檢視在服務基礎模型時延遲和成本的瓶頸,並學習如何克服它們
  • 選擇適合你需求的模型、資料集、評估基準和指標

Chip Huyen 致力於在 Voltron Data 使用 GPU 加速資料分析。她先前曾在 Snorkel AI 和 NVIDIA 工作,創辦了一家 AI 基礎設施的新創公司,並在史丹佛教授《機器學習系統設計》課程。她是《設計機器學習系統》一書的作者,該書是 Amazon 上 AI 類別的暢銷書。

AI 工程 是對 設計機器學習系統 (O'Reilly) 的補充與拓展。



大型語言模型 (LLM) 的提示工程

Author: John Berryman, Albert Ziegler
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

大型語言模型 (LLM) 的提示工程

[預覽 PDF]

大型語言模型 (LLMs) 正在改變世界,承諾自動化任務並解決複雜問題。 一個新世代的軟體應用正在使用這些模型作為建構模組,解鎖幾乎每個領域的嶄新潛力,但要可靠地利用這些能力需要新的技能。 本書將教你提示工程的藝術與科學 —— 解鎖 LLM 真正潛力的關鍵技巧。

業內專家 John Berryman 和 Albert Ziegler 分享如何與 AI 有效溝通,將你的想法轉化為語言模型友善的形式。 通過學習哲學基礎與實際技術,你將擁有知識與自信,來建立下一世代以 LLM 為驅動的應用程式。

  • 了解 LLM 的架構並學習如何最佳化與其互動
  • 為應用程式設計一個完整的提示製作策略
  • 蒐集、篩選並呈現上下文元素來打造高效的提示
  • 精通如少量樣本學習、連鎖思維提示、檢索輔助生成(RAG:Retrieval-Augmented Generation)等具體提示製作技術

實作生成式 AI:使用 Transformers 和 擴散模型

Author: Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

實作生成式 AI:使用 Transformers 和 擴散模型

[預覽 PDF]

透過這本實用的實作書籍,學習使用生成式 AI 技術來建立全新的文字、圖像、音訊,甚至音樂。讀者將能理解最新一代的生成模型如何運作,如何微調並依照需求進行調整, 以及如何結合既有的基礎工具來建立新的模型與在不同領域中的創意應用。

這本實用指引書以理論概念作為引導,並搭配實作應用,提供大量程式碼範例和易於理解的圖解說明。 你將學會如何使用開源函式庫來應用 Transformers 和擴散模型,進行程式碼探索,並研究多個現有的專案,以幫助指引你的工作方向。

  • 建立並自訂可生成文字與圖像的模型
  • 探討使用預訓練模型與自行微調模型間的權衡
  • 建立並運用可生成、編輯及修改任意風格圖像的模型
  • 為多種創意用途自訂 Transformers 和擴散模型
  • 訓練能反映你獨特風格的模型

開發者的大型語言模型安全手冊

Author: Steve Wilson
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

開發者的大型語言模型安全手冊

[預覽 PDF]

大型語言模型 (LLMs) 不僅在改變人工智慧的發展方向,也揭示了一個嶄新的安全挑戰時代。 本實用指南將帶你直擊這些威脅的核心。作者 Steve Wilson(Exabeam 的首席產品長)專注於 LLM,捨棄了廣泛的 AI 安全內容,深入探討這些模型固有的獨特特性和弱點。

本書結合了超過 400 位業界專家共同創立 OWASP LLMs Top 10 清單所累積的集體智慧,提供實戰指導和實用策略,幫助開發者和安全團隊應對 LLM 應用的真實挑戰。無論你正在架構新專案,或是在現有系統中加入 AI 功能,這本書都是你掌握下一代 AI 安全版圖的必備資源。

你將學到:

  • 為什麼 LLM 帶來獨特的安全挑戰
  • 如何應對使用 LLM 技術時相關的各種風險條件
  • 與 LLM 相關的威脅版圖,以及必須維持的關鍵信任邊界
  • 如何識別與 LLM 相關的主要風險與弱點
  • 部署防禦的方法以防禦針對主要弱點的攻擊
  • 如何主動管理系統中的關鍵信任邊界,以確保執行的安全性並將風險降到最低

實作大型語言模型

Author: Jay Alammar, Maarten Grootendorst
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

實作大型語言模型

[預覽 PDF]

人工智慧在過去幾年內獲得了驚人的語言能力。隨著深度學習的快速進步,語言人工智慧系統如今能夠比以往更好地撰寫與理解文字。 這項趨勢讓全新功能、產品,以及整個產業得以興起。透過本書,Python 開發者將學習運用這些能力的實用工具與概念。

你將學會如何運用預訓練的大型語言模型處理像是文案撰寫與摘要等使用案例;建立能超越關鍵字比對的語意搜尋系統; 構建能分類與群集文字資料的系統,以實現對大量文字資料檔案的可擴充理解;以及使用現有的函式庫和預訓練模型進行文字資料分類、搜尋及群集。

本書還將教你如何:

  • 建立進階的 LLM 管線以群集文字資料檔案並探索它們所屬的主題
  • 構建語意搜尋引擎,透過密集檢索與重排名等方法超越關鍵字搜尋
  • 學習這些模型能提供價值的各種使用案例
  • 理解基於 Transformer 的基礎模型架構,例如 BERT 和 GPT
  • 更深入地了解 LLM 如何被訓練
  • 理解不同的微調方法如何最佳化 LLM 用於特定應用(生成模型微調、對比式微調、上下文學習等)

使用 GPT-4 和 ChatGPT 開發應用程式

Author: Olivier Caelen, Marie-Alice Blete
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

使用 GPT-4 和 ChatGPT 開發應用程式

[預覽 PDF]

這本書是專為想要學習如何使用大型語言模型建立應用程式的 Python 開發者設計的理想指南。作者 Olivier Caelen 和 Marie-Alice Blete 詳細介紹了 GPT-4 和 GPT-3.5 模型的主要特性和優點,並解釋了它們的運作方式。你還可以獲得 使用 OpenAI Python 函式庫開發應用程式的逐步指南,包括文字生成、問答和智慧助手。

《使用 GPT-4 和 ChatGPT 開發應用程式》以清晰簡潔的語言撰寫,並包含易於遵循的範例,幫助你理解並將這些概念應用到你的專案中。Python 程式碼範例可在 GitHub 資源庫中找到,書中還包含關鍵術語的詞彙表。準備好將大型語言模型的能量應用到你的應用程式中了嗎?這本書是你的不二之選。

你將學習到:

  • GPT-4 和 GPT-3.5 模型的基礎及優點,包括主要特性及其運作方式
  • 如何將這些模型整合到基於 Python 的應用程式中,充分運用自然語言處理的能力並克服特定的大型語言模型相關挑戰
  • 展示如何在 Python 中使用 OpenAI API 的實例,涵蓋的任務包括文字生成、問題回答、內容摘要、分類等
  • 進階的大型語言模型主題,例如提示工程、為特定任務微調模型、RAG、插件、LangChain、LlamaIndex、GPTs 和智慧助手

Olivier Caelen 是 Worldline 的機器學習研究員,並在布魯塞爾大學教授機器學習課程。

Marie-Alice Blete 是 Worldline 研發部門的軟體架構師和資料工程師,專注於與 AI 解決方案相關的效能及延遲問題。


生成式 AI 的提示工程

Author: James Phoenix, Mike Taylor
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

生成式 AI 的提示工程

[預覽 PDF]

像 ChatGPT 和 Stable Diffusion 這樣的大型語言模型(LLMs)和擴散模型具有前所未有的潛能。 因為它們經過了網際網路上所有公開文字與圖片的訓練,所以能夠對各種任務做出有用的貢獻。 而如今,進入門檻已大幅降低,實際上任何開發者都可以利用 LLMs 和擴散模型來解決以往不適合自動化的問題。

透過這本書,你將奠定生成式 AI 的堅實基礎,包括如何將這些模型應用於實務中。 當開發者第一次將 LLMs 和擴散模型整合進其工作流程時,大多數人會苦於如何讓它們產出足夠可靠的結果,進而用於自動化系統。 作者 James Phoenix 與 Mike Taylor 將向你展示一套稱為提示工程的原則,讓你能夠有效地與 AI 合作。

學習如何賦予 AI 為你工作的能力。本書將解釋:

  • 你的程式中 AI 模型的互動鏈結結構,以及中間的細分步驟
  • 如何將應用問題轉換為模型訓練領域中的文件完成問題,進而生成 AI 模型請求
  • LLM 和擴散模型架構的影響 —— 以及如何以最佳方式與之互動
  • 這些原則如何在自然語言處理、文字與圖像生成,以及程式碼領域的實務中應用

機器學習面試

Author: Susan Shu Chang
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

機器學習面試

[預覽 PDF]

隨著科技產品在今天越來越普及,市場對機器學習專業人士的需求也持續增長。 然而,不同公司對機器學習專業人士的職責與所需技能組合仍有巨大差異,這使得面試過程難以預測。在本指南中,資料科學領域的領導者 Susan Shu Chang 將向你展示如何應對機器學習的招聘過程。

Chang 曾在多家企業擔任首席資料科學家,對於作為機器學習面試官與被面試者的兩種角色都具備豐富經驗。 她將通過分享她一路走來所學到的寶貴經驗,帶你穿越高度嚴格的招聘過程。你將快速理解如何成功通過典型的機器學習面試。

本指南將教你如何:

  • 探索多種機器學習角色,包括機器學習工程師、應用科學家、資料科學家及其它職位
  • 在決定追求哪種機器學習角色之前,評估你的興趣與技能
  • 評估你現有的技能,並彌補可能讓你在面試過程中失敗的技能差距
  • 習得每種機器學習角色所需的技能組合
  • 掌握機器學習面試的主題,包括程式碼評估、統計與機器學習理論,以及行為問題
  • 透過研讀常見的面試問題,準備統計與機器學習理論相關的面試

機器學習的訓練資料

Author: Anthony Sarkis
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

機器學習的訓練資料

[預覽 PDF]

你的訓練資料對於資料專案的成功與演算法本身一樣重要,因為大多數 AI 系統失敗的原因都與訓練資料有關。 然而,儘管訓練資料是成功的 AI 和機器學習的基礎,卻很少有全面的資源能幫助你精通這個過程。

在這本實作導向的指南中,作者 Anthony Sarkis —— Diffgram AI 訓練資料軟體的首席工程師 —— 向技術專業人士、管理者以及主題專家展示如何使用並擴充訓練資料,並闡明監管機器的人性化面向。 工程領導者、資料工程師以及資料科學專業人士都能從中對於成功使用訓練資料所需的概念、工具和流程有一個扎實的理解。

透過這本書,你將學到如何:

  • 有效處理訓練資料,包括架構、原始資料和標註
  • 使你的工作、團隊或組織更以 AI/ML 資料為中心
  • 向其他員工、團隊成員和利害關係人清晰解釋訓練資料的概念
  • 設計、部署及發佈生產級 AI 應用程式所需的訓練資料
  • 辨識並矯正基於訓練資料的新型故障模式,例如資料偏差
  • 自信地使用自動化工具更高效地建立訓練資料
  • 成功維護、操作並改進作為記錄的訓練資料系統

在 AWS 上的生成式 AI

Author: Chris Fregly, Antje Barth, Shelbee Eigenbrode
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

在 AWS 上的生成式 AI

[預覽 PDF]

如今,各家公司正迅速將生成式 AI 整合到它們的產品與服務中。 不過,對於這項技術的影響與承諾,存在著相當多的炒作(以及誤解)。 透過這本書,AWS 的 Chris Fregly、Antje Barth,以及 Shelbee Eigenbrode 協助 CTO、機器學習實務者、應用開發者、商業分析師、資料工程師和資料科學家找到實際應用這項令人興奮的新技術的方法。

你將學習生成式 AI 專案的生命週期,包括使用案例的定義、模型選擇、模型微調、檢索增強生成技術、 從人類回饋的強化學習、模型量化、最佳化及部署。 你也會探索不同的模型類型,包括大型語言模型(LLMs)和多模態模型, 例如用於生成影像的 Stable Diffusion 和用於回答影像相關問題的 Flamingo/IDEFICS。

  • 將生成式 AI 應用於你的業務使用案例
  • 判斷最適合你任務的生成式 AI 模型
  • 執行提示工程及情境式學習
  • 使用低秩調適(LoRA)將生成式 AI 模型在你的資料集上微調
  • 結合從人類回饋的強化學習(RLHF)使生成式 AI 模型與人類價值對齊
  • 透過檢索增強生成技術(RAG)對模型進行增強
  • 探索如 LangChain 和 ReAct 這些函式庫以開發代理和行為
  • 使用 Amazon Bedrock 建立生成式 AI 應用

建構資料與機器學習平台

Author: Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

建構資料與機器學習平台

[預覽 PDF]

所有雲端架構師都需要了解如何建立資料平台,讓企業能夠基於資料進行決策,並以快速且高效的方式提供全企業的智慧。 本手冊教你如何使用 AWS、Azure、Google Cloud,以及像 Snowflake 和 Databricks 的多雲工具, 來設計、建立與現代化雲端原生的資料與機器學習平台。

作者 Marco Tranquillin、Valliappa Lakshmanan 和 Firat Tekiner 涵蓋了從資料進入到啟用的整個資料生命週期, 他們使用真實世界的企業架構,教你如何在雲端環境中轉型、保護及現代化熟悉的解決方案, 例如資料倉儲與資料湖。此外,你將能運用最新的 AI/ML 模式,獲得更快速且精準的洞察,來提升競爭優勢。

你將學會如何:

  • 設計一個現代且安全的雲端原生或混合型資料分析與機器學習平台
  • 透過將企業資料整合到受控、可擴充且高韌性的資料平台來加速資料驅動的創新
  • 讓企業資料的存取更加民主化,並規範業務團隊如何提取洞察和建立 AI/ML 能力
  • 使用資料串流管道,讓你的企業能夠即時做出決策
  • 建立 MLOps 平台,轉向預測和處方分析的方法

低程式碼 AI

Author: Gwendolyn Stripling, Michael Abel
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

低程式碼 AI

[預覽 PDF]

低程式碼 AI 採取資料優先和案例導向的方法,來理解機器學習和深度學習的概念。這本實作指南提供三種專注於問題的方式, 幫助你學習免程式碼的機器學習(使用 AutoML)、低程式碼的機器學習(使用 BigQuery ML)以及自訂程式碼的機器學習(使用 scikit-learn 和 Keras)。 在每個案例中,你將透過具實際問題的真實世界資料集學習重要的機器學習概念。

商務與資料分析師能以專案為基礎的方式,採用詳細且以資料為驅動的方法來理解 ML/AI,包括載入與分析資料、將資料輸入機器學習模型、構建、訓練與測試, 以及將模型部署至生產環境。作者 Michael Abel 和 Gwendolyn Stripling 將教你如何針對零售、醫療、金融服務、能源和電信等領域構建機器學習模型。

你將學會:

  • 區分結構化資料及非結構化資料,以及它們所帶來的挑戰
  • 將資料進行視覺化與分析
  • 將資料預處理以供機器學習模型使用
  • 分辨回歸模型與分類監督式學習模型的差異
  • 比較不同的機器學習模型類型與架構,從免程式碼到低程式碼,再到自訂模型訓練
  • 設計、實作並調整機器學習模型
  • 將資料匯出至 GitHub 儲存庫,進行資料管理與治理

使用 Python 的機器學習配方手冊

Second Edition

Author: Susan Shu Chang
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

使用 Python 的機器學習配方手冊

[預覽 PDF]

這本實用指南提供了超過 200 個獨立的配方,幫助你解決在工作中可能遇到的機器學習挑戰。如果你熟悉 Python 及其相關函式庫,包括 pandas 和 scikit-learn, 你將能應對各種特定問題,從載入資料到訓練模型,甚至運用神經網路。

這個更新版本中的每個配方都包含可以直接複製、貼上並以玩具資料集運行的程式碼,以確保功能正常運作。從這裡開始,你可以根據自己的使用情境或應用進行調整。 每個配方都配有解決方案的討論內容,提供有意義的背景說明。

透過學習解構製作機器學習應用所需的基本元素,超越僅僅的理論與概念。你將在這裡找到以下內容的配方:

  • 向量、矩陣和陣列
  • 處理來自 CSV、JSON、SQL、資料庫、雲端存儲及其它來源的資料
  • 處理數值與類別資料、文字、影像以及日期與時間
  • 使用特徵萃取或特徵選取進行降維
  • 模型評估與選擇
  • 線性與邏輯回歸、決策樹與森林、k-近鄰演算法
  • 支援向量機 (SVM)、單純貝氏、聚類與基於樹的模型
  • 從多種框架儲存、載入及服務已訓練的模型

生成式深度學習

Second Edition

Author: David Foster
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

生成式深度學習

[預覽 PDF]

生成式 AI 是科技領域目前最熱門的話題。本實用書籍將教導機器學習工程師與資料科學家如何從零開始,使用 TensorFlow 和 Keras 建立令人印象深刻的生成式深度學習模型,包括變分自動編碼器 (VAEs)、生成對抗網路 (GANs)、Transformer、正規化流、基於能量的模型,以及去噪擴散模型。

本書以深度學習的基礎開始,逐步深入最前沿的架構。透過各種小技巧,你將學會如何讓模型學習得更有效率且更具創造力。

  • 了解 VAEs 如何改變照片中的面部表情
  • 訓練 GANs 以根據你自己的資料集生成影像
  • 建立擴散模型以產生新的花卉品種
  • 訓練自己的 GPT 用於文字生成
  • 學習像 ChatGPT 這樣的大型語言模型是如何被訓練的
  • 探索尖端架構,例如 StyleGAN2 和 ViT-VQGAN
  • 使用 Transformer 和 MuseGAN 創作複音音樂
  • 理解生成式世界模型如何解決強化學習任務
  • 深入研究多模態模型,例如 DALL.E 2、Imagen 和 Stable Diffusion

本書還探討了生成式 AI 的未來,以及個人與企業如何積極地運用這項非凡的新技術來創造競爭優勢。


實作機器學習:使用 Scikit-Learn、Keras 與 TensorFlow

Author: Aurélien Géron
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

實作機器學習:使用 Scikit-Learn、Keras 與 TensorFlow

[預覽 PDF]

透過近期的一系列突破,深度學習已經提升了整個機器學習領域的發展。現在,即使幾乎對這項技術一無所知的程式設計師,也能使用簡單且高效的工具來實現能夠從資料中學習的程式。 這本暢銷書藉由具體的範例、最低限度的理論,搭配生產等級的 Python 框架(Scikit-Learn、Keras 與 TensorFlow),幫助你直覺地理解構建智慧系統所需的概念與工具。

透過更新的第三版,作者 Aurélien Géron 探索了一系列技術,從簡單的線性回歸開始,進而討論到深層神經網路。書中的多數程式碼範例與練習能幫助你把所學應用到實作中。 你只需要擁有程式設計的經驗即可開始學習。

  • 使用 Scikit-Learn 追蹤一個範例機器學習專案的端到端流程
  • 探索多種模型,包括支援向量機、決策樹、隨機森林與整合方法
  • 運用無監督學習技術,例如降維、分群以及異常檢測
  • 深入探討神經網路的架構,包括卷積網路、循環網路、生成對抗網路、自編碼器、擴散模型與轉換器模型
  • 利用 TensorFlow 與 Keras 建立並訓練應用於電腦視覺、自然語言處理、生成模型與深度強化學習的神經網路

使用 Transformers 的自然語言處理,修訂版

Author: Lewis Tunstall, Leandro von Werra, Thomas Wolf
Publisher: O'Reilly
DRM-FREE Use on Any Device
PDF and ePUB

使用 Transformers 的自然語言處理,修訂版

[預覽 PDF]

自 2017 年首次引入以來,Transformers 很快成為實現各種自然語言處理任務中,達到業界最先進成果的主流架構。如果你是資料科學家或程式開發者, 本實用書籍 -現在經過全彩修訂- 將向你展示如何使用基於 Python 的深度學習函式庫 Hugging Face Transformers 來訓練並擴充這些大型模型。

Transformers 已被用於編寫逼真的新聞報導、改進 Google 搜尋查詢,甚至建立能講冷笑話的聊天機器人。 在本指南中,作者 Lewis Tunstall、Leandro von Werra 和 Thomas Wolf 他們是 Hugging Face Transformers 的部分創建者, 採用實作方法教你如何運作 Transformers 以及如何將其整合到你的應用程式中。你將快速學會它們可以幫助你解決的一系列任務。

  • 為核心 NLP 任務建立、除錯並最佳化 Transformers 模型,如文字分類、命名實體識別和問題回答
  • 學習如何使用 Transformers 進行跨語言遷移學習
  • 將 Transformers 應用於標註資料缺乏的真實場景
  • 使用知識蒸餾、模型剪枝和模型量化等技術,使 Transformers 模型適合部署
  • 從零開始訓練 Transformers,並學會如何擴充到多 GPU 和分佈式環境

支付 1 ~ 25 美元的費用,獲得 4 ~ 17 項資源
(總價值 1,182 美元)