用 AI 去分析我的视频素材库，整理分类

我一直以为，拍视频最难的是拍摄和剪辑。后来发现，真正麻烦的事情在它们中间：素材管理。

那些被相机、手机、Blackmagic、屏幕录制、下载目录、临时文件夹留下来的视频，安静地躺在 NAS 里。它们不是没有价值，只是没有名字，没有位置，也没有办法被快速想起来。时间久了以后，素材库就像一个没有地图的仓库，明明里面装着很多生活，却很难真的拿出来使用。

这一次，我想做的事情不是马上剪出一条 vlog，而是先把这些视频重新整理成一个可以被理解、可以被继续使用的素材库。

7473段素材进入统一素材库

10个一级方向重新分流

3 帧为每段视频建立初步判断

为什么要整理

过去的问题很简单：素材太多，路径太乱，文件名太抽象。很多视频还停留在类似 dam 2025-02-06 171914.078.MOV 这样的名字里。它确实是一段视频，但它没有告诉我拍摄时间之外的任何东西。

想剪京都的时候，我不知道哪些是寺社，哪些是街巷，哪些是餐厅，哪些只是路上的车窗风景。想剪武汉的时候，也很难快速找到街巷、建筑、植物、咖啡和生活片段。于是剪辑还没开始，人的耐心就先被文件夹消耗掉了。

我给系统定的规矩

这些素材不是普通文件，它们是过去几年里面随手拍下来的片段。里面有旅行，有武汉的街巷，有厨房、咖啡、植物、朋友、车窗外的路，还有很多当时没有想好怎么用、但后来可能会变得很重要的画面。

不删除任何媒体文件。
不覆盖已经存在的文件。
跳过路径中包含 已归档 的内容。
每一次移动、改名都留下日志。
移动之后校验文件大小，确认源文件和目标文件没有出错。

这几个规则看起来很保守，但我觉得整理素材库最重要的不是快，而是不要把记忆弄丢。

整理流程怎么跑起来

这个流程并不是要替我剪片，而是先把素材从混乱里捞出来，做一轮尽量稳定的初筛。

扫描 NAS 里的视频，读取文件信息。
从视频中抽取代表性画面，例如开始、中间、结尾各一帧。
根据画面给出内容、地点、场景和用途的初步判断。
生成更容易读懂的目录和文件名。
把把握比较高的素材移动到对应位置，把不确定的内容留在待复核。

这个过程听起来很机械，但真正跑起来的时候，会有一种很奇怪的感觉：那些原本只是一串文件名的视频，开始重新长出内容。

一个文件名的变化

原始文件名 dam 2025-02-06 171914.078.MOV

整理之后 20250206_日本京都_鸟居自动贩卖机_001.MOV

它突然就有了时间、地点、画面和用途。以后我要剪京都旅行，不需要再一条一条打开试试看，只要进入对应目录，就能找到寺社、街巷、餐饮、交通、人物、夜景这些素材。

阶段结果

项目	结果
合并范围	`· 原素材` 与 `· 视频素材`
新目录	`· 素材库`
完成移动/改名	7473 个视频
文件大小校验	7473 个全部通过
删除文件	0
覆盖文件	0
同名冲突	0

整理之后，我最喜欢的并不是数字，而是素材重新变得可被寻找。

分类后的世界

旅行记录：美国、日本、京都、中国城市与景点。
户外素材：外景 B-roll、街拍、Citywalk、徒步、无人机、城市延时。
生活记录：阳台植物、咖啡、美食、婚礼、朋友聚会、节日、汽车相关。
居家素材：厨房、咖啡、书房、卫生间、窗外日出、居家 B-roll。
剪辑工程：Final Cut Pro 原始媒体与转码媒体。
氛围与转场：氛围素材、趣味素材、片头片段。
待复核：暂时不能确定内容、地点或用途的素材。

以前想剪一个“京都”的片子，第一步不是打开剪辑软件，而是在一堆目录里迷路。现在我可以直接去看京都、伏见稻荷、寺社庭院、餐厅、街巷、交通这些目录。它们不是最终作品，但它们已经从“文件堆”变成了“素材语言”。

整理后的文件结构

为了让这个整理结果不是停留在概念里，我把素材库的结构树放在这里。它表达的是文件应该怎么被找到：先看素材类型，再进入地点、内容或项目状态。

· 素材库/
├── 01_实拍素材/
│   ├── 中国/
│   │   ├── 武汉/
│   │   │   ├── 家/
│   │   │   ├── 昙华林/
│   │   │   ├── 东湖/
│   │   │   └── 地点待确认/
│   │   ├── 襄阳/
│   │   └── 城市待确认/
│   ├── 日本/
│   │   ├── 京都/
│   │   │   ├── 伏见稻荷大社/
│   │   │   ├── 寺社古街/
│   │   │   ├── 餐饮店铺/
│   │   │   └── 地点待确认/
│   │   ├── 大阪/
│   │   ├── 东京/
│   │   └── 城市待确认/
│   ├── 美国/
│   │   ├── 旧金山/
│   │   ├── 洛杉矶/
│   │   └── 城市待确认/
│   └── 国家待确认/
├── 02_创作资产/
│   ├── B-roll通用/
│   ├── 转场素材/
│   ├── 氛围素材/
│   ├── 下载参考/
│   ├── 配乐/
│   └── 音效环境声/
├── 03_项目工程与导出/
│   ├── FCP/
│   │   ├── Vlog34/
│   │   │   ├── 原始媒体/
│   │   │   └── 转码媒体/
│   │   └── 户外Vlog/
│   ├── 达芬奇/
│   ├── 剪映/
│   ├── 导出成片/
│   └── 代理文件/
├── 04_录屏教程与游戏/
│   ├── 软件界面/
│   ├── 教程演示/
│   ├── 网页录制/
│   └── 游戏录像/
└── 99_待复核/
    ├── 地点待确认/
    ├── 内容待确认/
    ├── DAM相机待看/
    ├── iPhone原片待看/
    ├── Blackmagic相机待看/
    ├── 黑场或异常素材/
    └── 重复疑似/

这棵树不是为了炫耀分类有多细，而是为了让以后剪片时可以顺着路径找素材：真实拍摄先找地点，通用素材进创作资产，工程文件和导出成片单独管理，拿不准的内容先留在待复核。

抽帧分辨率实验

中间我还做了一个抽帧分辨率实验。样本是 30 个视频，每个视频取开始后 3 秒、中间、结束前 3 秒三帧，分别测试 720px、1080px、1440px。

分辨率	判断效果	结论
720px	大场景够用，细节和文字偏弱	适合低风险批量扫
1080px	地点、店招、菜单、小物件更稳	作为默认方案
1440px	细节略好，但收益有限	只在特殊 OCR 场景升级

最后的策略是：默认使用 1080px 三帧。这一步不需要把每一个视频都当成电影来审，它只负责回答几个很朴素的问题：这个视频大概是什么、在哪里、能放到哪个素材箱里。等真正剪片的时候，我再根据主题去挑选节奏、情绪和故事。

剪辑的开始

这件事让我重新想了一下“剪辑”的开始。

剪辑不一定是从时间线开始的。它可能从整理开始，从命名开始，从让素材重新被看见开始。过去我总觉得自己拍了很多东西，但没有剪出来就像没有完成。现在我觉得，那些素材其实没有消失，只是还没有被归类到一个能再次调用的位置。

这次整理帮我做的，是把这些散落的画面重新铺开。

它没有替我决定哪一段画面更有意义，也没有替我完成故事。它只是把 7473 段视频从混乱里拉出来，按时间、地点、内容和用途重新放好。剩下的部分，还是要由我自己去看、去选、去剪、去讲。

下一步，我想从整理好的素材库里选一个主题，真正剪出一条 vlog。也许是京都，也许是武汉街巷，也许是阳台植物，也许只是一些咖啡、窗外、桌面和路上的碎片。素材库已经开始有秩序了，接下来就该让这些画面重新动起来。