最近有个项目让大家很上头,叫 Flipbook。
整个浏览器界面全是 AI 实时生成的像素,输入一个词,点击页面上任意位置,就会生成新的图像,可以一直点,一直生成。
连 Simon Willison、Datasette 创始人、Karpathy这些科技圈大佬都转发说”这玩意儿挺有意思”。
看完是不是觉得确实很有意思,橘子姐五一在家玩了一天,我们来看看是怎么个事。
Flipbook 是什么?
Flipbook 是实验性 AI 无限视觉浏览器,核心是用 AI 实时生成像素流替代 HTML/CSS/ 网页,把整个互联网变成一本可无限翻页的 AI 画册一样。
产品团队的三个创始人分别是前 OpenAI、前 Apple、前 Slack 的工程师,一天不到就几十万人在讨论。
官网:https://flipbook.page/
可以在搜索框里输入任何词,或者上传一张图片,然后整个页面生成的看到的所有全是像素。
然后点哪里,哪里就会生成新的图像继续往下走。
比如输入”巴黎”,会生成一张巴黎的全景图。再点击埃菲尔铁塔,会生成铁塔的近景图。

一直点,就会一路一直深入下去。
背后技术是用 LTX Studio(开源 DiT 视频模型)在 Modal Labs 的GPU服务器上跑,通过WebSocket 把 1080p 24 帧的视频流直接推到浏览器。
与传统浏览器通过 HTML、CSS 等代码渲染网页不同,Flipbook 没有固定的代码结构或预定义的布局。
信息准确性大致相当于主流 AI 聊天模型 ChatGPT、Gemini等,会存在偶尔的不准确或渲染瑕疵。
五一玩了一天,顺便帮大家整理了最全的使用场景。
五大实用场景
01 旅行规划。
官方把旅行规划放在第一条,是最直接能体验到产品价值的场景。
这个五一想去三亚玩,没去成,那我来云游一下试试,输入”7 days in 三亚”,大概20秒左右,生成了一张完整的三亚行程图。上面有当天的路线,有景点位置,有地图。像是一张精心制作的旅行手册。
然后我点南山观音景点,会生成南山观音的近景渲染图,路线图,和推荐食物。
再继续点食物会对食物再进一步的介绍。
和传统旅行攻略比可太有意思了,传统攻略一张PPT,只能看不能动。Flipbook 是可以自己点来点去,随便探索的活地图,每个角落都可以点。
02 美食探索。
这个场景是我自己测试下来觉得挺惊艳的用法。
在Flipbook里搜索”成都小吃”,生成了一张包含麻婆豆腐、担担面、辣椒等的美食地图。我点了辣椒区域,生成了花椒、辣椒的特写,包含花椒和辣椒的介绍和制作方式。
我又点了冰粉区域,继续深入包含的食材,还有每个食材的介绍说明。
还可以更具体。比如我们试试”广式早茶”,生成了一桌点心,有虾饺、烧麦、叉烧包,居然还有特色的倒茶手势。
我点了手势区域,生成了关于喝茶、倒茶的具体手势图,有每个手势的介绍、用法场景。
太有活人感了~~
感觉特别适合明天要去某地出差,想快速了解一下当地有什么好吃的,特色礼仪啥的。不用在大众点评、小红书之间来回跳,所有东西都在一张可以无限点点点的视觉图里。
03 产品研究。
这个场景可以研究一些我们未涉及的领域,或者听说过,但没有见过或不了解的东西。
比如我输入“how a nuclear reactor works”,Flipbook 生成了一张核电站全景图,以及工作原理流程解刨图,详细标明了每个产品说明。
再点某一个物体,会继续生成深入介绍,内部结构解析,具体是如何工作的,看着是又生动又形象,像是实地去过一样。
还可以更接地气来用,比如搜索如何制作某种食物,输入“如何制作酸面团面包”。
Flipbook 生成了从酵种培养到烘培成品的完整流程图。
我点了酵种培养步骤,Flipbook 生成了酸面团酵种形成的过程,有不同时期的状态是什么样、有气泡结构说明,还标注了最佳时间、搭配比例、温度湿度等。
还能看到最终完美的酸面包的内部结构,气孔是什么样的最好,发酵不足和发酵过度是什么样的…
比看任何食谱书都有意思多了。
04 学习知识。
这个场景最大的感叹是,现在的孩子是真幸福啊。
我输入“动物世界”,生成了包含陆地、海洋、水里游的、天上飞的、地上跑的所有动物概览,继续点会继续下探。
属于是云上的点读笔,以后就不用再往家里买纸质书,后面优化如果加上音效播放,语音讲解介绍,那肯定会爆火~
不只是小孩子可以用来学习知识,大人也可以,比如一些历史事件。
我输入“法国大革命”,生成有巴士地狱、有断头台。随便点一个场景,继续生成了场景的详细解释,附带关键人物和事件节点。
你会不由自主的一直下探,Flipbook 的独特点就是你不知道自己会钻多深,但是一直钻一直有内容接住你。
中文渲染整体还是有一些问题的。
05 创意探索娱乐。
使用 Flipbook 最大的感触就是,太有创意了。
也很适合设计师、创作者在没有灵感的时候,打开 Flipbook 想输入什么就输入什么,看看 AI 能生成些什么。
有些内容可能会出现幻觉,但也不妨碍可以作为灵感来源,为你提供视觉头脑风暴,你来注入灵魂。
一些心得
Flipbook 现在还只是实验性产品,速度会有些慢,有 AI 幻觉,但却指向了一个非常有意思、很有创新的方向。
我们今天习以为常的界面范式,文本框、按钮、表单,花二十年搭建的基建,Flipbook 直接跳过了。未来的交互界面,可能根本不需要界面。
在 AI 时代,任何产品都可以像真实世界一样丰富和灵活,不需要我们去适应工具的逻辑,反过来工具应该适应我们的思维模式。
我相信随着模型越来越精准、越来越有状态,这套方式能处理的事情会越来越多,今天我们用 Flipbook 研究旅行规划需要再跳到别的 App 订票、订酒店,以后可能在 Flipbook 里完成一整个流程。
在新的范式转移出现和发生时,最先看见的人有优势。
原文链接:AI无限视觉浏览器 Flipbook,五大实用场景,我玩了一天




