欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
# 2024.5.23Today Summary
01 开芯院发布全球首个开源大规模 "NoC IP":温榆河
02 Kotlin 2.0.0 稳定版发布,K2 编译器已稳定
03 这个 MCU AI 软件,核心全开源
04 简体中文压缩数据只有 6TB
05 软件开发者必知的 10 大学习原则
06 高端处理器芯片包含两个核心 IP
07 华为有哪些能力是当前不可代替的?
08 杨立昆回应:辛顿错了,AI 不是核弹
09 小米追击智能驾驶,前图森 CTO 王乃岩将加入
10 大模型 “价格屠夫” DeepSeek 是谁?
11 Windows 11 将在中国区设备上安装「微软电脑管家」
12 过去十年中,有四分之一的网页已经消失
OpenSource Daily
开芯院发布全球首个开源大规模 "NoC IP":温榆河
北京开源芯片研究院(简称 “开芯院”)正式发布了全球首个开源大规模片上互联网络(Network on Chip,NoC)IP—— 研发代号「温榆河」,标志其在数据中心服务器芯片技术发展方面取得重要进展。
据介绍,NoC 作为面向数据中心服务器芯片除高性能处理器核之外的核心基础 IP,目前全球仅有 ARM 一家供应商,并在一定程度上限制 RISC-V 处理器核使用。
开芯院自项目成立以来,经过 18 个月的紧张开发,成功完成了支持 64 核互联的 NoC IP 开发和验证。目前,该 NoC IP 可交付企业进行评估,进一步推动了 RISC-V 生态的发展。
Kotlin 2.0.0 稳定版发布,K2 编译器已稳定
Kotlin 2.0.0 语言层面没有新特性,主要是引入 K2 编译器,提升了性能。官方此前介绍称,K2 编译器前端不仅仅是对旧编译器前端的重构,而是基于新架构从头开始的完全重写。
开发团队称他们已尽量减少破坏性更改的数量和影响,因此在开发阶段会 “有意识地避免在 Kotlin 2.0 中引入任何新功能”,并 “尽全力将代码从 Kotlin 1.9 迁移到 Kotlin 2.0 的影响降到最低”。
这个 MCU AI 软件,核心全开源
自从 AI 热潮降临,MCU 的 AI 算力就愈发强大。对 MCU 来说,TinyML 就是正在发生的变革。其最大的优点就是可移植性。在具有小电池和低功耗的廉价 MCU 上运行意味着,使用 TinyML,人们可以很容易地将 ML 以便宜的价格集成到几乎任何东西中。
SensiML 作为 TinyML 的先驱,前两日宣布计划贡献核心 IP、SensiML Analytics Studio 作为新的开源社区协作项目的基础,从而在开源道路上迈出了大胆的一步。
今日观察社交观察
不到 500 元!我买来了世界上第一款「串流掌机」
在 Nintendo Switch 登场之前,NVIDIA 其实还做过很多有趣的尝试。
在 NVIDIA 的显卡业务还没有今天那样如火如荼的时候,他们曾试着同时开展过多种业务,其中就包括了基于 ARM 架构的 Tegra 处理器,只可惜由于功耗、发热等原因,Tegra 处理器始终无法成为移动端市场里的主流,甚至一度还被冠以「高分低能」的称号。
然后,在某个时间点,老黄突然灵光一现。
如果说 Tegra 系列芯片因为功耗高、发热量大而遭到厂商弃用的话,那么我们自己制作一台游戏掌机,然后给它配备主动散热的话,又会得到什么样的结果呢?
而这,就是英伟达第一款 Android 设备 ——NVIDIA Shield 的故事。
-雷科技
简体中文压缩数据只有 6TB
Common Crawl 中文数据提取出来了,做了去黄等处理,发现简体中文压缩数据只有 6TB,解压后 30TB 左右,繁体压缩数据 6TB。中文数据到 2019 年冲到一个最大值,之后就回落了,不知道 2020 年具体发生了什么事情。。中文网页数据还是有点凋零。是不是有些网站不维护了?
- 微博梁斌penny
软件开发者必知的 10 大学习原则
市面上有许多介绍脑科学的流行书籍,比如《思考快与慢》,《心流》,《终身成长》等等,但是很少有将脑科学跟具体行业结合,教你如何学习的书。
这篇文章就属于这个行列,其中列出了软件开发者必知的 10 大学习原则
举个例子,理解概念的过程:从抽象到具体再回到抽象。其中提到了语义波。通过 “语义波” 的学习方法,你将在抽象定义和各种示例间频繁切换。
示例的多样性越高越好,甚至错误的示例,在与正确的对比中,也能帮助你理解错误之处。比如当你在学习什么是常量时,见到一个被错误标记为非常量的可变变量。这一学习过程被称作 “解包(unpacking)”。
通过这些不同的示例,你可以重新审视抽象定义,并对该概念形成更深刻的认识。这种深度理解来源于你如何将示例中的各个细节与定义中的抽象概念联系起来,这个过程被称为 “重新封装(repacking)”。
- 微博dingtingli
高端处理器芯片包含两个核心 IP
高端处理器芯片包含两个核心 IP:一个是负责计算的 CPU Core,比如 ARM Neoverse 系列的 V1/N1/V2/N2 核等;另一个是将几十上百个处理器核互联起来的片上网络 NoC(Network on Chip),可以看作是芯片内部的桥梁,比如 ARM CMN-600/700 系列 IP。
“香山” 高性能 RISC-V 处理器核是上述第一类 IP,目前已经发展到第三代,性能可以达到 ARM N2,前段时间刚在中关村论坛发布。D 但是对于第二类 NoC IP,尤其是单芯片百核级 NoC,目前全世界只有 ARM CMN 系列可选(Arteris FlexNoC 系列尚无实例),单次授权价格高达数亿人民币,而且还有诸多限制条款。
-微博 包云岗
为啥文心对外都免费了还收我们这么多
完,这下厂内兄弟更要问了,为啥文心对外都免费了还收我们这么多,那只能是……“基于红海行业进行需求分层,针对品牌边际效应构筑生态壁垒。分析 toC 客户非理性异动,捕捉痛点开辟差异化迭代路径。通过认知折叠简化用户接入成本,拉伸对齐传统行业实现商业模式闭环” 了——generated by yiyan.baidu.com
-微博 Rachel____Zhang
华为有哪些能力是当前不可代替的?
华为在工业软件和各种软件工具不可代替。华为带领合作伙伴搞定了 EDA 等 80 多款工业软件,还搞了大量软件开发工具。在华为之前,国内不是稀稀拉拉不成气候,就是一片空白,全被欧美、特别美国公司占领。这种情况下,万一发生类似俄罗斯处境时候,我们的相关领域会是一片狼藉,损失无法估量。也就是华为带领产业链兄弟连把这个领域快速填补了。
-微博 前HR本人
媒体观察
“深度学习” 三巨头之争,杨立昆回应:辛顿错了,AI 不是核弹
“它(AI)不是炸弹,它不是用来杀人的,AI 是为了让他们(人类)更聪明。所以,我根本不明白这个类比。而且,AI 也没那么危险。我认为这些系统比实际情况要聪明得多。现在 AI 的问题是,未来的力量是否足够,你认为它是否也会破坏一些东西?我们可以触及到人类智能的系统,我们可以考虑如何让它更加安全。” 杨立昆表示。
杨立昆强调,开源(AI 技术)很重要,是非常有意义的技术贡献。
-钛媒体
微软研究院刘铁岩:AI for Science,
憧憬一个人人都可参与科学发现的未来
「AI for Science 预示着一种全新的科学发现范式。通过构建统一的科学基座模型,AI for Science 将消除不同科学领域之间的壁垒,实现通过一个模型解决众多科学难题的目标。它还有望推动更加普及的科学探索范式,通过与基座模型交互,让每个人都能参与到科学发现的过程中。而为了实现这些愿景,我们必须要让科学基座模型超越人类语言的限制,去学习、理解大自然的语言。」
- ScienceAI
小米追击智能驾驶,前图森 CTO 王乃岩将加入
前图森未来中国 CTO 王乃岩将加入小米汽车,向小米技术委员会主席、小米汽车自动驾驶负责人叶航军汇报。此前,王乃岩主导图森未来中国的研发与管理工作,同时负责 L2 级辅助驾驶、L4 级自动驾驶方案的开发落地。
更早之前,王乃岩博士毕业于香港科技大学,擅长深度学习,是深度学习开源框架 MXNet 的核心开发者,在计算机视觉与机器学习顶级会议与期刊上曾发表论文 40 余篇。
- 36氪
英国监管机构 ICO 调查微软 “Recall” 利用 NPU 截屏的工作方式
英国数据监督机构称,它正在 "向微软询问" 一项新功能,该功能可以每隔几秒钟对笔记本电脑进行截图。微软表示,Recall 将在计算机本地存储加密快照,是即将推出的 Copilot+ PC 的独有功能。
但信息专员办公室(ICO)表示,它正在与微软联系,以获得更多有关该产品安全性的信息,隐私保护运动人士称其为潜在的 "隐私噩梦"。
- cnBeta
“白菜价” 始作俑者、大模型 “价格屠夫” DeepSeek 是谁?
在众多 AI 应用眼花缭乱地涌入市场时,AI 公司深度求索(DeepSeek)上周公告 DeepSeekChat 已通过北京市生成式人工智能服务备案,或将很快向公众开放服务。
DeepSeek 由知名私募巨头幻方量化于 2023 年 4 月创立。与月之暗面、智谱 AI、Minimax、百川智能等获得大厂投资的 AI 初创公司不同,DeepSeek 与科技巨头间并无直接关系。但这家公司仍然被视为一匹可能改变国内 AI 市场格局的 “黑马”。
5 月初,DeepSeek 宣布开源第二代 MoE 大模型 DeepSeek-V2。据介绍,该模型在性能上比肩 GPT-4 Turbo,价格却只有 GPT-4 的仅百分之一,这也让 DeepSeek 收获了 “AI 届拼多多” 的名号。
-蓝鲸TMT
今日推荐开源项目
linuxmint/timeshift
https://github.com/linuxmint/timeshift
Timeshift 是一个应用程序,提供类似于 Windows 中的系统还原功能和 macOS 中的 Time Machine 工具的功能。Timeshift 通过定期对文件系统进行增量快照来保护你的系统。这些快照可以在以后恢复,以撤销对系统的所有更改。
每日一博
如何优雅地编写缓存代码
缓存是什么,如何选择某一种缓存,都不是本文重点,今天就写写实际编码过程中,如何将缓存代码从业务代码中剥离出来,促使代码更简洁,更便于阅读。
https://my.oschina.net/u/4662964/blog/11104135
事件点评
Meta 成立新 AI 委员会,全白人男性阵容引质疑
Meta 周三宣布成立一个只有白人男性成员的人工智能顾问委员会,将定期与 Meta 的管理团队会面,为公司的人工智能和技术进步提供指导。
点评
Meta 的这一决策受到了广泛的质疑,因为它显然缺乏性别和种族的多样性。在一个日益全球化和多元化的世界中,一个全由白人男性组成的团队无法全面代表所有用户群体的需求和视角。
AI 技术的发展需要考虑到伦理、偏见和公平性问题。一个缺乏多样性的顾问团队可能无法充分识别和解决这些问题,因为他们可能无法充分理解所有受影响群体的经历和挑战。
Meta 作为全球知名的科技公司,其决策和行为对公众信任有着重要影响。这一决策可能会削弱公众对 Meta 在 AI 领域做出公正、负责任决策的信心。多样性是创新的重要驱动力之一。不同背景和经验的人能够带来不同的观点和想法,这对于推动技术创新至关重要。一个同质化的团队可能会限制这种创新潜力。
这一决策可能会对 Meta 的品牌形象和声誉造成损害,也为其他科技公司提供了一个警示,即在组建关键决策团队时,必须考虑到多样性和包容性,以避免类似的争议和负面影响。
微软近日发布了针对 Windows 11 的测试版更新,里面有一项变化提到:将在中国区设备上安装 PC Manager。
点评
这可能是微软为了更好地服务本地市场、提供更加本地化的系统管理工具所采取的措施。中国有着众多的电脑管理软件,微软通过预装「微软电脑管家」可能是为了在这个竞争激烈的市场中获得一席之地。
预装系统管理软件可能会对用户体验产生正面或负面的影响。一方面,它可以提供便捷的系统维护和优化功能;另一方面,如果用户感觉被强制使用某个软件,可能会引起不满。任何与系统深度集成的软件都可能引发用户对数据隐私的担忧。微软需要确保「微软电脑管家」在处理用户数据时是透明和安全的。
这一举措可能是微软构建和巩固其在中国软件生态系统中地位的一部分。通过提供官方认可的系统管理工具,微软可以更好地控制软件质量和用户体验。值得一提的是,在中国,遵守当地法律法规是企业运营的重要部分。微软可能需要确保其「电脑管家」符合中国的网络安全和数据保护法规。
ChatGPT 严重宕机,结果被造谣 “遭遇俄罗斯黑客入侵”
ChatGPT 出现重大宕机事故,涉及到 ChatGPT Web 端和移动 App。
点评
ChatGPT 的宕机事件凸显了对于高流量在线服务平台而言,保证服务的稳定性和可靠性至关重要。宕机不仅影响用户体验,还可能对企业的信誉和财务状况造成影响。面对服务中断,OpenAI 的危机管理能力受到考验。他们需要迅速定位问题、修复故障,并及时向用户通报情况,以减轻负面影响。
通过有效的问题解决和沟通策略,企业可以在用户中建立起信任。反之,如果处理不当,可能会失去用户的信任和支持。ChatGPT 的宕机也反映出用户对于 AI 服务的依赖程度。随着 AI 服务在日常生活中扮演越来越重要的角色,任何服务中断都可能对用户的工作或生活造成影响。
此次事件可能会促使 OpenAI 和其他 AI 服务提供商在未来加强系统的冗余设计和灾难恢复计划,以提高服务的鲁棒性。对于那些散布虚假信息的行为,需要有相应的法律和道德约束。这不仅是对受影响企业的尊重,也是维护健康网络环境的必要措施。
开源之声
媒体观点
ChatGPT 会把学校干掉吗
一些传统理论也将受到挑战。以人才培养中常用的 “木桶理论” 为例,传统观点认为,一个木桶能装多少水,取决于最短的那块木板。但生成式人工智能时代,刘晓光提出新的观点 —— 未来一个木桶盛多少水,取决于最长的一块板,“其他那些短的板怎么办,由其他人补齐”。
-中国青年报
大模型降价,一场没有赢家的战争
降价的本质是要加速大模型落地。大模型不能只停留在写诗作画,还得 “下基层”。降价的背后是通过触达千行百业和获取更大样本容量的合作案例,从中提取共性特征,形成合理、高效的大模型行业标准。
-光子星球
AI 创业,追逐风口但别轻信 “红利”——专访 AI 人机交互专家季啸白
从长期来说,图像生成 AI 一定是和人类大脑协作,而不是取代人类的摄影和图像创作。摄影是对客观事物的捕捉,也是拍摄者情绪和思考的表达。我很喜欢画画和摄影,AI 技术虽然在不断演进,但人类主动创作的主观表达是永远无法替代的。
-扬子晚报网
王小川:大模型价格战会加速泡沫周期,我们做 C 端的就别掺合了
谈及近期大模型价格战,王小川对钛媒体 App 表示,价格免费是优势,但不一定是竞争力。To C 是建立影响力的一部分,既有超级模型又有超级应用是做商业化成功失败的重要条件。而在市场规模和覆盖层面,中国的市场 C(消费)端就比 B(企业端)端大 10 倍,美国做 ToB 是特别好的生意。
-钛媒体
用户观点
Windows 11 将在中国区设备上安装「微软电脑管家」
ChatGPT 严重宕机,结果被造谣 “遭遇俄罗斯黑客入侵”
- 观点 1:这玩意儿我装过两次,第一次死机重启,第二次卡成 PPT,不知道它在搞什么
- 观点 2:win11 ad 版
- 观点 3:早就装上了。但感觉没啥用。跟 360 那些 软件一个 鸟样
- 观点 4:除了老坛酸菜,其他的一切都不考虑。win11 自 23h2 后安装软件慢得狠,也没看到别人说,我是个好几个机器都是一样,22h2 没这毛病,泄露的 win11 老坛酸菜也有安装软件慢的毛病
- 观点 5:我安装使用了快半年,没发现有啥好用的,而且 UI 有些地方很不合理,比如无法拖拽,路径、名称等显示不全。部分功能确实引起 cpu 飙升。比如查找重复文件,大文件,且只能选择非常挫。每次优化建议第一条就是锁定 edge 的首页,但是首页是被锁定到百毒拼音.com?dg=xxxxx 这样的,所以,说是广告版,国内特供版,没冤枉它,可能还不如某数字安全卫士极速版😀
报告:过去十年中,有四分之一的网页已经消失
- 观点 1:不 DOWN 机的服务不是好服务
- 观点 2:让 ChatGPT 自己修复问题?^_^
Kotlin 2.0.0 稳定版发布,K2 编译器已稳定
- 观点 1:我用 4 美元在 Unstoppable Domains 注册了个去中心化域名,一次注册,不用续年费。然后在 ipfs 空间网站上上传网页并解析域名,网页永远都存在。
- 观点 2:放在那里也是成本,所以...... 就没了
- 观点 3:大浪淘沙,没用的自然会被淘汰
- 观点 4:小站点(个人站点)运营周期短,大的网站改一次版,就可能导致一些页面永久 “消失”,至于社交媒体上的内容,设置可见时间、删除、账号被封禁、甚至运营方会主动屏蔽、降权某些语言的的博文~
- 观点 5:app 是不是消失的更多
- 观点 :kotlin 做后端 2 年了,最大的感觉就是比 java 写起来更流畅
程序员梗图
END
References
https://www.oschina.net/news/293833
https://www.oschina.net/news/293822/kotlin-2-0-0
https://mp.weixin.qq.com/s/83DoYoN0Juo5NtbyHfcszw
https://mp.ofweek.com/znyj/a756714977407
https://weibo.com/1497035431/NevUys55V
https://weibo.com/1834645454/OfsUsm1ZF
https://weibo.com/3626485974/OfyqQ3oyd
https://weibo.com/2607574543/OflrmxZsc
https://weibo.com/1686707751/OfvUAkRJ5
https://mp.weixin.qq.com/s/DQMJzE_joy40JO3AemuthA
https://www.cnbeta.com.tw/articles/tech/1431847.htm
https://36kr.com/p/2725829228143878
https://mp.weixin.qq.com/s/G5iX0pkLIHoCMduWkjN0vA
https://ishare.ifeng.com/c/s/8ZoeOs5bd5v
https://github.com/linuxmint/timeshift
https://my.oschina.net/u/4662964/blog/11104135
https://www.oschina.net/news/293884/metas-new-ai-council-white-men
https://www.oschina.net/news/293848
https://www.oschina.net/news/293790/chatgpt-down
https://ishare.ifeng.com/c/s/8ZoYdDA8pM8
https://www.yangtse.com/content/1863747.html
https://finance.sina.cn/cj/2024-05-22/detail-inawcech8712484.d.html
https://finance.sina.cn/2024-05-23/detail-inawefqu8129252.d.html
https://www.oschina.net/news/293679/when-online-content-disappears
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享