原标题:DeepSeek独创东说念主梁文锋回湛江过年,家乡拉横幅接待打卡搭客
近日,火爆海表里的DeepSeek独创东说念主回到家乡湛江米历岭村过年。1月30日,羊城晚报记者从其同乡处获悉,梁文锋于1月28日(大除夕)回到米历岭村过年,1月29日(大年月吉)上昼离开家乡。
梁文锋回湛江过年,家乡拉横幅接待打卡搭客(视频截图)
该同乡默示,这几天有许多搭客到村里来拍照打卡,熙来攘往。为此,当地还在村口拉上了横幅以表接待。
同乡梁文惠与梁文锋同辈,亦然学友。他回忆,梁文锋从小就瑕瑜常灵巧、有资质的东说念主,“咱们以前都知说念,他(梁文锋)初中就学完高中的数学了”,“但他比拟内向,过年过节回家一般也不怎么外出”。
据此前报说念,2002年,17岁的梁文锋考上浙江大学本科电子信息工程专科。大学时期,梁文锋与同学一皆驱动集中阛阓行情数据和探索全自动量化往复。
2023年,梁文锋创立DeepSeek(深度求索),2025年1月27日,DeepSeek一度登顶苹果中国地区和好意思国地区诳骗商店免费APP下载名次榜,致使被国外称为“来自东方的玄妙力量”。
2025年1月28日,据央视新闻,DeepSeek倏得碰到大批国外报复。DeepSeek官网炫耀,其线上服务受到大限制坏心报复。奇安信安全行家炫耀,此次受到的网罗报复,IP地址都在好意思国。
文|记者 赵翊辰
蔓延阅读
国产大模子公司深度求索(DeepSeek)独创东说念主梁文锋参加了总理谈话会。
据新华社报说念,中共中央政事局常委、国务院总理李强1月20日下昼主抓召开行家、企业家和教科文卫体等鸿沟代表谈话会,听取对《政府处事申诉(征求成见稿)》的成见忽视。谈话会上,张辉、任少波、刘珺、梁文锋、魏洪兴、陈学东、陈红彦、杜斌、邹敬园等先后发言。
其中,梁文锋恰是头部量化私募幻方量化独创东说念主、DeepSeek的独创东说念主。
梁文锋参加总理谈话会(视频截图)
低调的“量化天王”
梁文锋“发迹”于量化投资。
动作别称“80后”,梁文锋本科、磋议生都就读于浙江大学,领有信息与电子工程学系本科和硕士学位。
2008年起,梁文锋就驱动指示团队使用机器学习等时期探索全自动量化往复。2015年,幻方量化谨慎成立,2019年,其资金贬责限制就浮松百亿元。
2019年,梁文锋在当年的金牛奖授奖典礼上,发表主题演讲《别称要领员眼里中国量化投资的畴昔》,这是他有数的公开荒言。
在演讲中,梁文锋指出,量化与非量化的判定递次即是在投资方案的经由中,是用数目化时势进行方案的,如故用东说念主进行方案的。量化公司是莫得基金司理的,基金司理就一堆服务器。
“动作私募,投资东说念主对咱们的生机是很高的,如果一年跑赢指数低于25%,投资东说念主是不适意的。”梁文锋指出,量化投资照旧赚了时期面家数原本赚的钱,畴昔也要洗劫基本面家数原本赚的钱。
演讲终末,梁文锋说,幻方量化的职责即是提高中国二级阛阓的有用性。
2021年,幻方量化成为国内首家浮松千亿限制的的量化私募大厂,被称为国内量化私募“四大天王”之一。不外,就在这一年,由于功绩波动,幻方量化关闭了全部召募通说念,并在12月底发布致投资者公开信,致歉称“幻方功绩的回撤达到历史最大值,咱们对此深感羞愧”,究其原因,主如果AI的投资方案在贸易时点上莫得作念好,阛阓作风剧烈切换的时期,AI会倾向于冒更大的风险来博取更多收益,进一步加大了回撤。
尔后,幻方量化逐步镌汰其资金贬责限制。2024年10月,幻方量化还向投资者发布公告称,盘算推算巩固对冲家具投资仓位镌汰至零。
“短期内莫得融资盘算推算”
梁文锋关于AI的兴味早就有迹可循。
2016年10月21日,幻方量化推出第一个AI模子,第一份由深度学习生成的往复仓位上线扩充,使用GPU进行策动。2017年,幻方量化声称兑现投资战略全面AI化。
幻方量化官网炫耀,其在2018年就建设以AI为公司的主要发展办法。
2020年驱动,幻方累计投资超亿元、占大地积绝顶于一个篮球场的AI超等策动机“萤火一号”谨慎进入运作,堪称不错匹敌4万台个东说念主电脑的超等算力。2021年,幻方进入十亿建设“萤火二号”,以“任务级分时分享”为核情怀念,转念系统秒级响应,ag百家乐怎样杀猪平台配备巨大的软件层因循:高性能算子库(hfai.nn)、散播式稽查通信框架(hfreduce)、专为AI开荒而生的大容量高带宽文献系统(3FS),让AI模子能自由拓展到多节点之上,进行大限制并行稽查,算力扩容翻倍,集群贯串满载运行,平均占用率达到96%以上。
2021年,在梁文锋参与的论文中提到,他们正在部署的萤火二号系统,“配备了1万张A100GPU芯片”,在性能上接近DGX-A100(英伟达推出的东说念主工智能专用超等策动机),但资本镌汰了一半,同期能耗减少了40%。
那时国内高出1万枚GPU的企业不高出5家,何况除了幻方量化除外,其他4家公司都是互联网大厂。
这背后需要极其浑朴的财力因循。
2023年头,幻方量化默示,当年的几年,幻方量化及职工每年拿出收入的一部分进入公益,回馈社会,累计捐赠高出5.8亿元。其中,2022年,职工“一只庸碌的小猪”个东说念主就向慈善机构捐赠1.38亿元,那时的音问指出,这个东说念主即是梁文锋。这从一个侧面响应出了幻方量化和梁文锋本东说念主的“不差钱”。
幻方量化曾默示,多年以来,该公司坚抓把营收的大部分进入东说念主工智能鸿沟,建设开端的AI硬件基础设施,进行大限制的磋议,探索东说念主类未知的精巧,“咱们敬佩险些通盘的改进都是从斗胆尝试和点滴集中中滋长而来。”
梁文锋在为数未几的对外发声中相似也提到“短期内莫得融资盘算推算”,并以为当底下临的问题“从来不是钱,而是高端芯片(短缺)”。
“AI界拼多多”
2023年7月,幻方量化通顺利立大模子公司DeepSeek,谨慎进击通用东说念主工智能鸿沟。据报说念,DeepSeek包括独创东说念主梁文锋在内,仅有139名工程师和磋议东说念主员。与之对比,OpenAI有1200名磋议东说念主员,Anthropic则有500多名磋议东说念主员。
只是不到一年的2024年5月,DeepSeek就发布了DeepSeekV2,因为改进的模子架构和史无先例的性价比,火爆出圈。DeepSeek-V2的API订价为每百万tokens输入1元、输出2元,价钱仅为GPT-4 Turbo的百分之一。
关于为何能作念到如斯高的性价比,DeepSeek官方证实称,DeepSeek-V2取舍了改进的架构,举例庄重力机制方面的MLA(多头潜在庄重力)和前馈网罗方面的DeepSeekMoE架构等,以兑现具有更高经济性的稽查成果和更高效的推理。
因此, DeepSeek被称为“AI界的拼多多”,激勉了字节、阿里、百度等大厂的大模子价钱战,纷纷通知大模子家具降价。彼时,梁文锋在经受媒体采访时称,DeepSeek意外成为行业鲇鱼,廉价背后是但愿算力普惠。
2024年12月27日,DeepSeek-V3更是横空出世,火爆民众。据DeepSeek官网炫耀,其评测得益不仅高出了Qwen2.5-72B(阿里自研大模子)和Llama 3.1-405B(Meta自研大模子)等顶级开源模子,致使能和GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模子)等顶级闭源模子一较上下。
DeepSeek通知上线并同步开源DeepSeek-V3模子除外,还公布了长达53页的稽查和时期细节。获取大幅升级的V3模子是在一个“难以思象”的预算下稽查完成的:通盘稽查仅破耗了557.6万好意思元,在2048块英伟达H800 GPU(针对中国阛阓的低配版 GPU)集群上运行55天完成,仅是OpenAI GPT-4o模子稽查资本的不到十分之一。
“中国也要巩固成为孝敬者,而不是一直搭便车。”梁文峰在经受媒体采访时说,“咱们照旧民俗摩尔定律从天而下,躺在家里18个月就会出来更好的硬件和软件,Scaling Law(限制定律)也在被如斯对待。但其实,这是西方主导的时期社区一代代皓首穷经创造出来的,只因为之前咱们莫得参与这个经由,以至于忽视了它的存在。好多国产芯片发展不起来,亦然因为穷乏配套的时期社区,唯有第二手音问,中国势必需要有东说念主站到时期的前沿。”
梁文锋和他的DeepSeek还在陆续求索。
就在1月20日, DeepSeek谨慎发布DeepSeek-R1模子。该模子在数学、代码、当然言语推理等任务上,性能并列OpenAI o1郑再版。DeepSeek称,R1在后稽查阶段大限制使用了强化学习时期,在仅有少许标注数据的情况下,极大提高了模子推理能力。DeepSeek不仅将R1稽查时期全部公开,还蒸馏了6个小模子开源给社区,允许用户借此稽查其他模子。
“投身于探索AGI的实质,不作念中和的事,带着意思心,用最永远的眼神去复兴最大的问题。”DeepSeek的公众号这么写说念。