2025-03-14
#Wandering 虽然还有点模糊,但是感觉,未来是不是应该有个平台或区域,让Agent自由玩耍,或者人机共建、协作。
2025-03-14
对于AI这种24小时响应,没有情绪,没有废话,只有响应的特点,还是很满意的。
只是在智能水平、任务的完成度上还有进步空间,另外在人机磨合上感觉还有很多事要做。人类的做事方式和智能的提供方式,还是有些卡壳的感觉。怎么让智能变为水,融入到生活中呢?
“用过AI编程之后,再去找人提需求等结果,会产生很强的不适感。
找AI做事都是从来没废话,管你需求合不合理、反不反复、想没想清楚,直接给你上结果。更重要是不用管排期、优先级,全天24小时响应。对于创作者来说,需求能够快速实现、验证、修改,趁着创作热情高涨的时候一鼓作气做完太重要了。
未来或许很快,内容创作的中间环节就会逐渐消失,每个需求方都可以通过AI直接快速实现和调试自己的想法。
程序员的角色也会逐渐转变,纯粹替产品给计算机传话的程序员会消失。要么转为产品,要么转为架构师或技术协调人的角色,负责整个项目的架构规划、代码审查、合并与规范制定。架构师来负责每个模块,每个人的AI rules,相当于每个人的AI都是他的程序员小弟,要遵循他的规范做事。”
“现在和AI的每一次沟通,都相当于面对一个全新的,第一次见面的「小弟」。他对你和你工作的认识来自于你给他的聊天记录、小纸条、文档、工程资料,以及靠他自己去做各种搜索和查询。他做好不好,极大程度受限于你是否了解他的能力边界,给到的指令是否清晰,Context是否足够。”
X@DashHuang
https://x.com/DashHuang/status/1898939887245733927
2025-03-13
完整复盘 Manus的诞生过程
https://mp.weixin.qq.com/s/tflIfbGLLXOq_VMef4rn4A
2025-03-13
Software eating the world. Agent eating software?
网上购票软件几乎吃掉了影院线下售票,未来的Agent会不会吃掉网上购票软件?人只要与Agent交互,软件给Agent提供元能力就行,把在映影片、附近影院、场次、位置数据、价格给Agent就好,中间会有摩擦,需要适应和Agent任务完成度优化,但可行。
菜鸟、12306同理,大众点评也有可能,微博、豆瓣、小红书、淘宝,难,但有可能。
这个Agent在哪产生就另说了,外人可能更有意愿去做,但软件原厂拥有的数据和用户,更适合孵化出对应的Agent。
https://a16z.com/why-software-is-eating-the-world/
2025-03-12
只要敢于舍弃
很多事情就没这么难
即刻@玉伯
https://m.okjike.com/originalPosts/67d04cf470a62475fdad045b
2025-03-12
2025-03-12
I need a agent like TARS or CASE.
Hope one day agents will be as good as them.
They need memory, motivation, plans, actions and characteristics.
We are explorers, Rom. This is our boat.
2025-03-11
灯光美,气氛佳。
每一段关系里面最重要的是,尊重,沟通。
第一次遇见花香的那刻S2E7
2025-03-11
最近听到了很多有意思的歌,觉得有好歌听太幸福了,决定给人生信条上加上一条:有好听的歌吗?
最近反复循环还是这张专,《COWBOY BEBOP Tank! the! Best!》
Jazz for your soul!
【星际牛仔的音乐为什么这么神?B站最深度解析!】 https://www.bilibili.com/video/BV14y4y1H73K
Ai Higuchi – Kanashii Uta ga Aru Riyuu / THE FIRST TAKE
https://www.youtube.com/watch?v=wNb1-E-r08s
2025-03-11
“如今 AI 如同新型材料涌现,我们需要重新定义权衡公式:是优先模型精度还是响应速度?是追求通用性还是垂直场景深度?
AI 语言模型让我联想到铝材的工业化——当这项新材料成本足够低时,就会催生空中旅行这样的范式革命。我们现在正处在为 AI 时代重新设计“飞机”的历史节点。
这就像计算机在半导体技术成熟前无法诞生——新技术总会解锁新的权衡维度。我们需要在技术可能性和人类行为惯性间寻找平衡。”
“最重要的仍然是构建自己感兴趣的东西,同时在用户需求和自己感兴趣的东西之间找到平衡。”
https://mp.weixin.qq.com/s/W4NNKOv01tQroNqbJIZKtw
https://www.youtube.com/watch?v=IIPKMixTMfE
2025-03-11
有时候看到别人总是能引经据典,说出哪本书哪本书里面说的了什么什么,或者哪个企业家之前有一段什么经历。哈哈好厉害,我就啥都记不住,只是看过就看过了,可能对我来说,只有是对自己重要的东西才会记得比较清楚吧。
2025-03-11
#Wandering 尽量简单的东西,非碎片的东西,成体系的东西。
2025-03-10
“我们哪是热爱 AI,我们只是渴望回到那个狂野的年代 。”🥺
微博@i陆三金
https://weibo.com/1706699904/PhNBzn2zD?pagetype=detail
2025-03-10
准备恢复前几年尝试了一段时间的每周一片,周六晚上 19 点看一部电影,从杨德昌系列开始。
杨德昌导演的电影作品包括以下几部:
-
《光阴的故事》:1982年,106 分钟左右。
-
《海滩的一天》:1983年,166 分钟左右。
-
《青梅竹马》:1985年,120 分钟左右。
-
《恐怖分子》:1986年,109 分钟左右。
-
《牯岭街少年杀人事件》:1991年,237分钟左右。
-
《独立时代》:1994年,125 分钟左右。
-
《麻将》:1996年,120分钟左右。
-
《一一》:2000年,173分钟左右。
2025-03-10
简介:《自私的基因》认为任何生物,包括我们自己,都只是求生的机器。这本书是实实在在的认知科学,复制、变异和淘汰简单的三种机制可以演变出所有大千世界生命现象里的林林总总。
张小龙曾在饭否提到:《自私的基因》搞的我看神马都是用基因自私理论来分析。想法如同基因,有生存价值的想法最终会取得传播的胜利。这是《自私的基因》里关于文化基因的观点
简介:《人类简史》,以色列新锐历史学家的一部重磅作品。从十万年前有生命迹象开始到21世纪资本、科技交织的人类发展史。
数年前,当微信团队变得越来越庞大,张小龙在内部“领导力大会”演讲中推荐了这本《人类简史》。从人类发展、村落的形成、组织的形成,思考如何保持“小团队”应有的创造力。
https://www.zhihu.com/tardis/zm/art/442787229
2025-03-10
07/01 “Before product-market fit, find passion-market fit”
https://mp.weixin.qq.com/s/M6l6GbdaHQRkg2Ls4VgRZA
2025-03-09
AI应用创业要与大模型能力正交。模型能力随着时间增长,个人在另一个维度上持续投入,正交的维度,同时每次模型能力提升,应用能在模型提升中受益。
2025-03-09
应用很大程度上依赖底层模型,现在做的agent很有可能会被底层模型的进步吃掉,底层模型的提升才是最重要的,这就要看到RFT、RL post-training里去了,而普通玩家,在这里有机会吗?🥺
可以去看下MCP协议,BrowserUseTool这些技术的东西。不过还有一种可能是模型跳过人类阅读浏览器这一步?
产品效果,应用层可以做得很牛。但严重依赖底层模型。实际上无论哪个产品,表现都是严重依赖底层模型的,大家发现有些产品效果很牛,实际上是 O3 或者 Claude 3.7 这些顶尖模型的能力,换一些弱的模型,效果可能翻车。https://mp.weixin.qq.com/s/8hh5yI_s86nyL-mKf3q97A
MCP 协议:
https://mp.weixin.qq.com/s/5Bph-10vb—Rx9XHPsu_5Q
Openmanus:
https://mp.weixin.qq.com/s/RMtQu-o6s-9HcQTLIo4Xaw
模型和应用如何共存:
https://mp.weixin.qq.com/s/Ywf5oehCca5IyY6z6duz8w
2025-03-09
这期播客给出了一种新的方式,让AI作为一个主体去用,给模型很多个人特征作为记忆,一个数字版的我。把自己不愿面对的东西,抗拒的事情,隐藏的事情,让AI去清晰解构,自己作为一个旁观者去看自己,让这个数字版的自己,接入广阔的知识,客观地看到自己的思考和忧虑,期待是想有一些心理咨询的作用。然后开了monica的Pro版订阅,输入基本记忆,开始试一试。
“AI as me”,是一种通过AI镜像化自己,从另一个角度审视自己内心和状态的方法。
可能不完全有用,可能会有坏处,不过可以尝试一下。
[1]播客:
https://www.xiaoyuzhoufm.com/episode/67b4860679129523d43903db
[2]摘录:
https://mp.weixin.qq.com/s/3rudrP4IsIu5ejQE_VMbrA
2025-03-08
“创造力需要留白具体来说就是日历留出空档。在读书时的自由思考,散步时的漫不经心,日常里展开无用的冒险。让灵感的小幽灵们对话、嬉戏和碰撞,试着自下而上、信马由缰。写作、设计产品或做决定,试试放手、感受那涌现的力量。”
即刻 @Szhans
2025-03-07
去影院看了 Flow,挺喜欢猫猫的,挺好玩的。
看到一条短评觉得挺有意思的。
“一艘船上的五只动物代表马斯洛需求的五个层次。水豚追求吃喝拉撒睡,是最基础的生理需求,也是小猫第一个同伴。狐猴代表安全需求,保护财产,避免威胁,但狐猴保卫的是一堆毫无价值的瓶瓶罐罐,他是二号同伴。三号是金毛狗,代表社交需要,无论是坏社交(狐朋狗友),还是好社交(与小猫),都是对爱和归属感的需要。然后是鹭鹰,对尊重的需要,人类理性中最高贵最接近神性的一部分。最后小猫则是自我实现的需求,它不断在大洪水和漂流中经历五个需求的变化,最后在拯救河豚的行动中完成自我。片中数次表现小猫落水,片尾它亦凝视水中倒影的自己。洪水代表潜意识,鲸鱼代表想象中自由的自我和搁浅时恐惧的自我,所有的自我需求都隐藏在潜意识的深水区里,等待下一次的潮起潮落。”
豆瓣@饿霸地煮
2025-03-07
当模型进步,可以完成更多事情,人们也在不停做出新工具去适配模型的智能外溢。
在思考这些模型原理、Agent 实现方式时,有一个很有意思的点是,模型原理和产品设计,和人类大脑结构、思考和行动逻辑,之间的呼应。
某种更加复杂、还不够清晰的仿生学。
当我们探索这些模型的边界,产品设计的方式时,我们也许也正在更加了解我们人类自身,我们是怎么想的,我们是怎么做的,我们的大脑,我们的手脚,我们的想法怎么变为行动的。
这很有意思,也有很多可以讨论的东西。
另外一个,或许可以从更高维度,来看,我们要完成这些任务,是要解决什么问题,起到什么效果。总有种感觉,现在的很多 flow 都有点冗余,为了做事而做事,很多都是没必要的杂事。有种感觉,能有一套更简洁的流程达到同样的效果,更智能,更少碎片,空出更多 Wandering time。
https://mp.weixin.qq.com/s/FcZ0CbBcnonKr3D2rnI04g
(最后一段提到的东西很有意思。“我们的大脑与 AI 会不会形成一种「我们」的关系?不是我在「使用」客体工具,而是「你是我的一部分」「你我是一体」的共存状态?”)
https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0f
(小红的观察和思考很有意思。02:02:14 “大模型应用的分类和方法论:主场景补充、模型能力带来的变化、模型能力在特定领域的外溢。” 02:45:20 某一段提到了模型和产品发展的过程,具体时间点没找到,后面再找一下。大概意思是,产品形态,从表单对话,到 chatbot 类似人类对话,到 cursor 类的获取更多上下文和将模型回答更自然地用于代码修改上,到 devin 的类似一次性派任务下去,产品主动使用工具完成一个任务。)
【OpenAI Agent黑客马拉松 闪电演讲 by Andrej Karpathy等大佬 】 https://www.bilibili.com/video/BV1zX4y1q7s7
(开头 Andrej 的开场很有意思,“某些想法很容易想到,很容易做出 demo 来演示,但是成为一个完整的产品很困难,像自动驾驶”,“回到神经科学并再次从中获取灵感是很有意思的,底层等价物是什么,Agent 中,用于记忆的海马体是什么样的,将所有信息整理起来的丘脑是什么样的”,不过提出都两年了,目前还没见到效果比较好的产品是咋回事,timing)
https://mp.weixin.qq.com/s/P47F8KE7SPRdUpODcnKKhQ 、
https://mp.weixin.qq.com/s/oecpFKV0iog4mK5MNBvTfw 、
(manus 相关,介绍,效果,补充,技术分析,还不错但是不用过度兴奋。)
2025-03-06
“有时候,当你听到一张非常厉害的专辑或一首歌时,会想去了解它背后的故事。在英文中,这被称为 liner notes(唱片内页说明)。遗憾的是,如今许多音乐作品并没有提供这样的内容。其实,阅读经典作品的 liner notes,了解创作背景、制作细节和过程,往往能带来很多收获,不仅能获取有价值的信息,还能深受感动。”
【对话陶喆【HOPICO x 声音速写ep27】】 https://b23.tv/iEf612S
2025-03-04
工作室,好帅噢。
2025-03-03
1 make it small.
2 create easy routines.
3 do something for two minutes.
2025-03-02
开始听星际牛仔的原声,感觉要开启一阵新的体验,真他丫的好听啊!🥹
分享山根麻以/Seatbelts的单曲《Gotta Knock a Little Harder》
分享菅野よう子的单曲《Tank!》
2025-03-02
I dont give a fuck. 做我想做的事。对想法和身体更有掌控感才行。不要被网络带着走了。
2025-02-28
“别问我机会在哪里,现在是AI产业革命的早期,遍地都是机会,五年后,十年后你回头看,现在就是个遍地金矿的时代。当然,你现在看不见也正常,25年前,绝大部分人对互联网的机会也是看不见的。”
https://mp.weixin.qq.com/s/07qQrap9ISzJgpp4lSoIEQ
2025-02-28
GPT4.5 情商高,api 超贵,基准测试一般,幻觉降低。无监督学习的巅峰,pre-train 跑到尽头的模型,听未官方确认的消息说 moe 激活参数有 1T,总参数可能有 10T 以上。现在的模型不能用简单的分析去看它了,像 DS 的 V3,OpenAI 之前的 o1-preview,好像都是看着一般,但是是产生强大模型的前哨模型。期待 4.5 的推理模型。发布会上提到了无监督学习和推理的互相增强,确实好奇 GPT5 会有什么样的效果。无监督是推理的基础,推理诱导出无监督的智能,这两者,很奇妙,很有意思。
超大参数的无监督学习,能在压缩过程中,吸收多少智能?概念知识,思维逻辑,可能都会比之前的多很多,只是可能不能很好地召出,这样大的模型,需要很多的蒸馏或者强化。但是是未来强大模型的基石,但是这么大的基础模型。是否真的有效果,要再看了,OpenAI 训这个模型的成本肯定很高。
想想,ODR 那个强化的内容还需要再看,从基模中做强化学习的训练任务,能激发什么能力?纠错,反思,还有啥。
OpenAI12 月那个直播,RFT,还是大杀器,很多神奇的东西需要研究那个。延展分析,像企业中,有什么业务能利用上 RFT,需要强化什么能力,怎么定义结果奖励。
怎么利用企业数据,哈哈,可能我也没有用企业数据的机会吧,外面搞搞就好。
[1]https://mp.weixin.qq.com/s/_jDcwdRQEjT41QnwsxIxOg
[2]https://mp.weixin.qq.com/s/IKkv_O4ogWq2bxLEPz0pVA
[3]https://mp.weixin.qq.com/s/CtIhtdLd-zS0rXb8KN_V-A
[4]GPT4.5的系统卡:
https://cdn.openai.com/gpt-4-5-system-card.pdf
[5]OpenAI研究总监Mark Chen 谈 GPT-4.5:https://www.bigtechnology.com/p/openai-chief-research-officer-mark
[6]ODR团队访谈:
https://mp.weixin.qq.com/s/c3pbcVA0xpYkMz0QndFLuQ
这个方法的核心是:我们采用最先进的推理模型,让它能够使用与人类完全相同的工具来完成工作或日常任务,然后直接针对我们期望agent能实现的具体目标进行优化。这个方法本质上完全没有任何限制,绝对可以不断扩展到更复杂的任务中。我认为AGI现在已经变成了一个操作性问题,这个通用公式还有很多令人期待的发展空间。
[7]https://mp.weixin.qq.com/s/ygayaF0fOT9ZpDxLNHaZxA
[8]AI 如何突破技术与商业壁垒: