Frank的博客

记录自己的思考,关于技术、创业与生活

大模型背后的数据供应商 - Surge AI

第一次知道Surge AI这家公司是看到Edwin Chen的播客访谈,正值他们第一次出来融资,Edwin极其务实高效的观点让人印象深刻

豆包AI手机背后的VL模型

根据公开报道,豆包AI手机使用的模型是基于UI-TARS在手机上优化的闭源版本,UI-TARS是在阿里的Qwen2 VL上做SFT得来的,目前开源了7b的版本(Qwen2 VL开源了3b-72b的模型)。这里不再多介绍Qwen(Qwen2 VL其实也已经有了UI Operation的功能),主要关注UI-TARS模型在Qwen2 VL上的进一步改进,分数据和训练两部分。

使用UTM标签来分析流量来源

我们在做推广的时候,通常会采用多个渠道:cold email、google广告投放、twitter推广、seo优化、社区内容等等,弄清楚我们流量来源和转化效果是至关重要的,这样可以帮助我们进一步优化营销策略。今天分享一种简单的方式来区分流量以及分析转化效果:

jenni.ai的冷启动与增长策略

jenni.ai是用来辅助论文写作与阅读的工具,目前收入已经达到了$5M ARR,用户2.5M,并还在高速增长,作者表示预期能达到$10M~20M ARR,他们的CEO David Park非常诚意的分享了他们的收入和用户的增长策略,有很多值得学习的地方

startup的相关福利

最近打算薅一下羊毛,梳理了国外大厂给的福利,主要是云和openai的token

PyTorch训练加速的量化分析

本文从一个baseline出发,通过软件+硬件各种方法逐步对训练速度进行优化,最终将训练时间减少为1/8

神经网络架构搜索(NAS)中的milestones

神经网络架构搜索(NAS)今年也是火的不行,本文简单梳理一下个人觉得比较有代表意义的工作,如果有错误或者遗漏欢迎大家指出hhhh