2024 年 LLM 推理成本下降 10 倍?
不少大模型产品价格降幅达50%以上,有的产品价格降幅甚至超过90%。今年为什么 LLM 成本会下降?这个公网应该很少人完整的聊过。
抖音:Interest Clock 论文解读
抖音最近发布的 Paper 《Interest Clock: Time Perception in Real-Time Streaming Recommendation System》中,发现用户的偏好是动态的并且随时间波动。例如,在短视频平台中,用户可能会在早上喜欢新闻视频,而在晚上则喜欢娱乐视频。在音乐平台上,用户喜欢早上听DJ,晚上听催眠音乐。因此,使推荐模型能够感知时间信息,为用户提供时间感知的个性化服务,从而显着改善用户体验非常重要。
How To Select The Right Technology Solution
When faced with multiple uncertain options, list them separately and consider factors such as man hours, difficulty, degree of liability, and length of time for future support. Quantify and use indicators to assess
《金字塔原理》读书笔记
按照金字塔结构理清表达思想的顺序,是写出条理清晰的文章的最重要方式,清晰的顺序就是先提出总结性思想,再提出被总结的具体思想。
人、钱、事
在过去的几个月里,我曾深陷困惑,思考如何将人与成本联系起来、如何培养人才、如何构建团队梯队以及如何提高整个团队的效率。然而,通过与其它公司的 CTO 和更资深的创业者、Leader 等交流,并真正静下心来学习“管理”这个领域,我有一天突然领悟到,所谓的研发管理其实就是三个要素:人、钱、事。