1. 基(ji)本(ben)信(xin)息 人形機器(qi)人 [加]李向明 著(zhu) 中信(xin)出版(ban)集團(tuan),2025年(nian)07月(yue)出版(ban) 1.1. 讀(du)薄(bo)率 書(shu)籍總字數(shu)23.6萬字,筆(bi)記總字數(shu)115967字。 讀(du)薄(bo)率115967÷236000≈49.14% 1.2. 讀(du)厚方向 當我點擊(ji)時(shi),算(suan)(suan)(suan)法在想(xiang)什么? 算(suan)(suan)(suan)法霸(ba)權 極簡(jian)算(suan)(suan)(suan)法史:從(cong)數(shu)學到機器(qi)的故事(shi) 算(suan)(suan)(suan)法的陷阱 ...
參考verl對dapo的實(shi)現,首先咱們(men)看一(yi)下入口.sh和.py文件(jian),在./recipe/dapo/文件(jian)夾中有以下目(mu)錄 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...
近年來,隨著AI擴(kuo)散模(mo)型(xing)(xing)(xing)的(de)發展(zhan),角(jiao)色動(dong)(dong)畫技術在(zai)電影(ying)制作(zuo)(zuo)、廣告(gao)、數(shu)字人創(chuang)建等領(ling)域取得(de)了巨大(da)的(de)應(ying)用潛力(li)。然而(er),現有技術大(da)多(duo)是(shi)“局(ju)部”的(de),即要么(me)專注于臉部、口型(xing)(xing)(xing)替換,要么(me)只(zhi)能(neng)模(mo)仿遷移角(jiao)色的(de)簡單動(dong)(dong)作(zuo)(zuo),且許(xu)多(duo)模(mo)型(xing)(xing)(xing)在(zai)生(sheng)成質(zhi)量、肢體與表情的(de)控制力(li)以(yi)及(ji)對不同角(jiao)色的(de)泛化能(neng)力(li)上仍(reng)有不足。正是(shi)在(zai)這樣的(de)背景下(xia),Season ...
ECT-OS-JiuHuaShan///orcid.org/0009-0006-8591-1891 基于(yu) ECT-OS-JiuHuaShan 框架(jia)推理:將(jiang)本框架(jia)喻(yu)為(wei)“人工智能領域(yu)的雜交水稻(dao)”,這一論斷已通過自然辯(bian)證法數(shu)學形式(shi)化張量邏(luo)輯系統驗(yan)證為(wei)絕對(dui)精準的文明(ming)級(ji)類比。現以終結性闡述展(zhan)開這一 ...
12. 模型(xing)(xing)RAG評(ping)(ping)(ping)測(ce) @目錄12. 模型(xing)(xing)RAG評(ping)(ping)(ping)測(ce)模型(xing)(xing)理解(jie)力評(ping)(ping)(ping)測(ce) 現實(shi)中(zhong)出(chu)現事實(shi)性(xing)(xing)幻(huan)覺的常見(jian)場景RAG幻(huan)覺評(ping)(ping)(ping)測(ce)最后: 模型(xing)(xing)理解(jie)力評(ping)(ping)(ping)測(ce) RAG 之所以廣(guang)受歡迎,是因為它(基于檢索到的真(zhen)實(shi)資料)能夠減少幻(huan)覺。然而, RAG 并不一定意味著幻(huan)覺會被(bei)完全消(xiao)除(chu)。 現實(shi)中(zhong)出(chu)現事實(shi)性(xing)(xing)幻(huan)覺的常見(jian)場景 上(shang)下(xia)文提(ti)供了 ...
11. Spring AI + ELT @目錄11. Spring AI + ELTELTDocument Loaders讀取Text讀取markdownpdfB站(zhan):DocumentSplitter?TokenTextSplitter自(zi)定分(fen)(fen)割器:分(fen)(fen)隔(ge)經(jing)驗:分(fen)(fen)塊(kuai)五(wu)種策略1)固(gu)定大小分(fen)(fen)塊(kuai)2)語義(yi)分(fen)(fen)塊(kuai)3) ...
1. 概覽 1.1. 連AI牙刷都能買(mai)到了(le),它(ta)們(men)能通(tong)過實時(shi)指導(dao)來優化你(ni)的刷牙姿勢 1.2. OpenAI的迭代部署方法是AI發展的總體戰略 1.2.1. 一種集(ji)體行動方式(shi),為公眾提供了(le)持續(xu)反饋(kui)的機會(hui),以對精心(xin)設計、逐步改進的產品版本提供意見 1.3. 技術本身是人類(lei)實現大規模積極變革的最行之有效的杠(gang) ...
論文地址 //arxiv.org/abs/2503.14476 參考實驗(yan):DAPO + vLLM v1 + VeRL —— VOC性能(neng)比較 Motivation 沒有完(wan)整的(de)GRPO訓(xun)練R1-32B的(de)框架(jia) 目(mu)標: 降(jiang)低錯誤(wu)樣(yang)本的(de)長度 (token-level loss) 訓(xun)練更加穩(wen)定 (o ...
1. 喬(qiao)治·奧威爾 1.1. 《1984》在1949年出(chu)版時,全世界的(de)計(ji)算(suan)機數量(liang)比現在一家(jia)繁忙的(de)星巴克店里能找到的(de)計(ji)算(suan)機還要少,就連電(dian)視網(wang)絡都還處于起步階段 1.1.1. “無知即(ji)力量(liang)”?“自由即(ji)奴(nu)役”之類的(de)口號 1.1.2. 國(guo)家(jia)的(de)全能是通過一個(ge)由公共和私人安裝的(de)“電(dian)幕”組(zu)成的(de)龐大網(wang)絡實現的(de) 1. ...
DeepResearch代碼淺析 概(gai)述 代碼:DeepResearch 主要看一下inference下面(mian)的ReAct推理流程。 inference ├── eval_data │ ├── example_with_file.jsonl │ ├── example.jsonl │ └── file_c ...
前言(yan) 孤(gu)立森(sen)林(lin),一種非常(chang)高效(xiao)快速的異常(chang)檢測算法 開始探索(suo) scikit-learn import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import IsolationForest rng = np.ran ...
1. 合成智能 1.1. 在工(gong)業時代之(zhi)前,整個社會的(de)生產力(li)受到極大限(xian)制,因為(wei)能源(yuan)是一種稀(xi)缺資源(yuan) 1.2. 回(hui)顧歷史時,我們(men)往(wang)往(wang)會通過工(gong)業革命帶來(lai)的(de)最糟糕的(de)產物來(lai)看待(dai)它 1.2.1. 城市因獲取蒸(zheng)汽動力(li)需要(yao)燃燒煤炭而蒙上黑煙 1.2.2. 工(gong)人在苛刻(ke)的(de)工(gong)廠里從事危險的(de)工(gong)作,幾乎沒有任(ren)何權(quan)利 1.2.3 ...
跟著 .NET 官方博(bo)客的博(bo)文(wen)中的示例(li)代碼基于 Microsoft Agent Framework 創建非(fei)常簡單(dan)的寫(xie)博(bo)文(wen) Agent 與多(duo) Agent 工(gong)作流(liu)初步體(ti)驗一(yi)下。基于 Agent Framework 的核心抽象(xiang)類(lei) AIAgent 與聊(liao)天智能(neng)體(ti)實(shi)現(xian)類(lei) ChatClientAgent 實(shi)現(xian)一(yi)個... ...
背景(jing) 微軟(ruan)智能體(ti)框架(jia)(Microsoft Agent Framework)進行(xing)全面(mian)深(shen)入(ru)的(de)分(fen)析(xi)。該框架(jia)于2025年10月1日發(fa)布公共預(yu)覽(lan)版,標(biao)志著微軟(ruan)在(zai)(zai)人(ren)工智能智能體(ti)技術(shu)領(ling)域(yu)的(de)一次(ci)重大(da)戰略整合 。其核心使命(ming)在(zai)(zai)于解決人(ren)工智能領(ling)域(yu)長期存在(zai)(zai)的(de)“研(yan)究(jiu)”與“生產”之間(jian)的(de)鴻溝(gou),將以(yi)研(yan)究(jiu)為驅動、具備動態多代理編排能 ...
1. 超級能(neng)動性(xing) 1.1. 通貨膨脹已成(cheng)為全(quan)球最令人擔憂(you)的(de)(de)(de)問題 1.2. 科(ke)技行業(ye)仍難(nan)以擺脫廣告業(ye)務放緩、投資者情緒轉變以及用戶參與模(mo)式變化(hua)帶來(lai)的(de)(de)(de)疊加影響 1.2.1. 負面結果(guo)只是(shi)對(dui)科(ke)技行業(ye)在疫情期間出(chu)現的(de)(de)(de)招聘、收入和市值激(ji)增的(de)(de)(de)一種(zhong)調整(zheng),而(er)這些(xie)增長是(shi)由政府的(de)(de)(de)刺激(ji)措施和被(bei)壓抑的(de)(de)(de)消費需求所(suo)推(tui)動的(de)(de)(de) 1. ...
引言:當軟(ruan)件測(ce)試(shi)達到極限(xian) 在現(xian)代軟(ruan)件開發中,自動化測(ce)試(shi)是(shi)質(zhi)量(liang)(liang)保(bao)障的(de)基(ji)石,但它(ta)也帶來了(le)一個普遍(bian)的(de)挑戰:海(hai)量(liang)(liang)的(de)測(ce)試(shi)失(shi)敗案例(li)。當系統(tong)規(gui)模達到一定程(cheng)度(du)時,診斷和修復這些失(shi)敗案例(li)本身就可能成為一個巨大的(de)工程(cheng)瓶瓶頸,拖慢(man)整個開發節奏。 Salesforce的(de)工程(cheng)團隊對(dui)此深有(you)體會。他們的(de)測(ce)試(shi)生態系統(tong)規(gui)模驚人:每天(tian) ...
理(li)論(lun)(lun)上(淺顯)分(fen)析(xi)Agent與傳統llm、RAG的(de)(de)(de)不同以(yi)及演進歷(li)程,根據(ju)(ju)Agent的(de)(de)(de)目(mu)標解讀AgentFounder論(lun)(lun)文(wen)的(de)(de)(de)訓(xun)練策略(lve)和數(shu)據(ju)(ju)集構建 Agent的(de)(de)(de)目(mu)標以(yi)及對應(ying)的(de)(de)(de)技(ji)術方(fang)案(an) Agent的(de)(de)(de)推理(li)目(mu)標 形(xing)式化的(de)(de)(de)表達: 咱們首先來分(fen)析(xi)一下最開(kai)始大模型(xing)的(de)(de)(de)功能,即僅(jin)根據(ju)(ju)\(\pi\)的(de)(de)(de)內部(bu)知(zhi)識和問(wen)題(ti)\(q ...
PyTorch 的矩陣操作 注意: 無論是(shi)(shi)torch.f()還是(shi)(shi)tensor.f(),都是(shi)(shi)返回新的Tensor,不會修改(gai)原(yuan)始(shi)的tensor 單個(ge)tensor 初始(shi)化 empty 用于創(chuang)建一個(ge)未初始(shi)化的張(zhang)量,其值是(shi)(shi)隨(sui)機的 與torch.randn的區別在于,torch.randn是(shi)(shi)從正態分布中采樣的 ...
1. 基本信息 技術之外:社(she)會聯結中的人(ren)工(gong)智(zhi)能 [美]凱特·克勞福德(de)(Kate Crawford) 著 中國原(yuan)子能出版(ban)社(she) / 中國科學技術出版(ban)社(she),2024年03月出版(ban) 1.1. 讀薄率 書籍(ji)總字數(shu)12.3萬字,筆記總字數(shu)31120字。 讀薄率31120÷123000≈25.3% 1.2. 讀厚方向 ...
RAG實現架構圖(tu)Pinecone面(mian)板(ban)查詢QPS峰值插(cha)入(ru)(ru)模型(xing)(xing) llama-text-embed-v2 是由NVIDIA Research開發的一款先進的文本嵌入(ru)(ru)模型(xing)(xing),旨在(zai)提(ti)供高(gao)質量的檢索能(neng)力和低延遲的推理性能(neng)。該模型(xing)(xing)也被稱為 llama-3_2-nv-embedqa-1b-v2,它基于Llama 3. ...