用 AI 去分析我的视频素材库,整理分类

我一直以为,拍视频最难的是拍摄和剪辑。后来发现,真正麻烦的事情在它们中间:素材管理。

那些被相机、手机、Blackmagic、屏幕录制、下载目录、临时文件夹留下来的视频,安静地躺在 NAS 里。它们不是没有价值,只是没有名字,没有位置,也没有办法被快速想起来。时间久了以后,素材库就像一个没有地图的仓库,明明里面装着很多生活,却很难真的拿出来使用。

这一次,我想做的事情不是马上剪出一条 vlog,而是先把这些视频重新整理成一个可以被理解、可以被继续使用的素材库。

7473段素材进入统一素材库
10个一级方向重新分流
3 帧为每段视频建立初步判断

为什么要整理

过去的问题很简单:素材太多,路径太乱,文件名太抽象。很多视频还停留在类似 dam 2025-02-06 171914.078.MOV 这样的名字里。它确实是一段视频,但它没有告诉我拍摄时间之外的任何东西。

想剪京都的时候,我不知道哪些是寺社,哪些是街巷,哪些是餐厅,哪些只是路上的车窗风景。想剪武汉的时候,也很难快速找到街巷、建筑、植物、咖啡和生活片段。于是剪辑还没开始,人的耐心就先被文件夹消耗掉了。

我给系统定的规矩

这些素材不是普通文件,它们是过去几年里面随手拍下来的片段。里面有旅行,有武汉的街巷,有厨房、咖啡、植物、朋友、车窗外的路,还有很多当时没有想好怎么用、但后来可能会变得很重要的画面。

  • 不删除任何媒体文件。
  • 不覆盖已经存在的文件。
  • 跳过路径中包含 已归档 的内容。
  • 每一次移动、改名都留下日志。
  • 移动之后校验文件大小,确认源文件和目标文件没有出错。

这几个规则看起来很保守,但我觉得整理素材库最重要的不是快,而是不要把记忆弄丢。

整理流程怎么跑起来

这个流程并不是要替我剪片,而是先把素材从混乱里捞出来,做一轮尽量稳定的初筛。

  1. 扫描 NAS 里的视频,读取文件信息。
  2. 从视频中抽取代表性画面,例如开始、中间、结尾各一帧。
  3. 根据画面给出内容、地点、场景和用途的初步判断。
  4. 生成更容易读懂的目录和文件名。
  5. 把把握比较高的素材移动到对应位置,把不确定的内容留在待复核。

这个过程听起来很机械,但真正跑起来的时候,会有一种很奇怪的感觉:那些原本只是一串文件名的视频,开始重新长出内容。

一个文件名的变化

原始文件名 dam 2025-02-06 171914.078.MOV
整理之后 20250206_日本京都_鸟居自动贩卖机_001.MOV

它突然就有了时间、地点、画面和用途。以后我要剪京都旅行,不需要再一条一条打开试试看,只要进入对应目录,就能找到寺社、街巷、餐饮、交通、人物、夜景这些素材。

阶段结果

项目结果
合并范围· 原素材· 视频素材
新目录· 素材库
完成移动/改名7473 个视频
文件大小校验7473 个全部通过
删除文件0
覆盖文件0
同名冲突0

整理之后,我最喜欢的并不是数字,而是素材重新变得可被寻找。

分类后的世界

  • 旅行记录:美国、日本、京都、中国城市与景点。
  • 户外素材:外景 B-roll、街拍、Citywalk、徒步、无人机、城市延时。
  • 生活记录:阳台植物、咖啡、美食、婚礼、朋友聚会、节日、汽车相关。
  • 居家素材:厨房、咖啡、书房、卫生间、窗外日出、居家 B-roll。
  • 剪辑工程:Final Cut Pro 原始媒体与转码媒体。
  • 氛围与转场:氛围素材、趣味素材、片头片段。
  • 待复核:暂时不能确定内容、地点或用途的素材。

以前想剪一个“京都”的片子,第一步不是打开剪辑软件,而是在一堆目录里迷路。现在我可以直接去看京都、伏见稻荷、寺社庭院、餐厅、街巷、交通这些目录。它们不是最终作品,但它们已经从“文件堆”变成了“素材语言”。

整理后的文件结构

为了让这个整理结果不是停留在概念里,我把素材库的结构树放在这里。它表达的是文件应该怎么被找到:先看素材类型,再进入地点、内容或项目状态。

· 素材库/
├── 01_实拍素材/
│   ├── 中国/
│   │   ├── 武汉/
│   │   │   ├── 家/
│   │   │   ├── 昙华林/
│   │   │   ├── 东湖/
│   │   │   └── 地点待确认/
│   │   ├── 襄阳/
│   │   └── 城市待确认/
│   ├── 日本/
│   │   ├── 京都/
│   │   │   ├── 伏见稻荷大社/
│   │   │   ├── 寺社古街/
│   │   │   ├── 餐饮店铺/
│   │   │   └── 地点待确认/
│   │   ├── 大阪/
│   │   ├── 东京/
│   │   └── 城市待确认/
│   ├── 美国/
│   │   ├── 旧金山/
│   │   ├── 洛杉矶/
│   │   └── 城市待确认/
│   └── 国家待确认/
├── 02_创作资产/
│   ├── B-roll通用/
│   ├── 转场素材/
│   ├── 氛围素材/
│   ├── 下载参考/
│   ├── 配乐/
│   └── 音效环境声/
├── 03_项目工程与导出/
│   ├── FCP/
│   │   ├── Vlog34/
│   │   │   ├── 原始媒体/
│   │   │   └── 转码媒体/
│   │   └── 户外Vlog/
│   ├── 达芬奇/
│   ├── 剪映/
│   ├── 导出成片/
│   └── 代理文件/
├── 04_录屏教程与游戏/
│   ├── 软件界面/
│   ├── 教程演示/
│   ├── 网页录制/
│   └── 游戏录像/
└── 99_待复核/
    ├── 地点待确认/
    ├── 内容待确认/
    ├── DAM相机待看/
    ├── iPhone原片待看/
    ├── Blackmagic相机待看/
    ├── 黑场或异常素材/
    └── 重复疑似/

这棵树不是为了炫耀分类有多细,而是为了让以后剪片时可以顺着路径找素材:真实拍摄先找地点,通用素材进创作资产,工程文件和导出成片单独管理,拿不准的内容先留在待复核。

抽帧分辨率实验

中间我还做了一个抽帧分辨率实验。样本是 30 个视频,每个视频取开始后 3 秒、中间、结束前 3 秒三帧,分别测试 720px、1080px、1440px。

分辨率判断效果结论
720px大场景够用,细节和文字偏弱适合低风险批量扫
1080px地点、店招、菜单、小物件更稳作为默认方案
1440px细节略好,但收益有限只在特殊 OCR 场景升级

最后的策略是:默认使用 1080px 三帧。这一步不需要把每一个视频都当成电影来审,它只负责回答几个很朴素的问题:这个视频大概是什么、在哪里、能放到哪个素材箱里。等真正剪片的时候,我再根据主题去挑选节奏、情绪和故事。

剪辑的开始

这件事让我重新想了一下“剪辑”的开始。

剪辑不一定是从时间线开始的。它可能从整理开始,从命名开始,从让素材重新被看见开始。过去我总觉得自己拍了很多东西,但没有剪出来就像没有完成。现在我觉得,那些素材其实没有消失,只是还没有被归类到一个能再次调用的位置。

这次整理帮我做的,是把这些散落的画面重新铺开。

它没有替我决定哪一段画面更有意义,也没有替我完成故事。它只是把 7473 段视频从混乱里拉出来,按时间、地点、内容和用途重新放好。剩下的部分,还是要由我自己去看、去选、去剪、去讲。

下一步,我想从整理好的素材库里选一个主题,真正剪出一条 vlog。也许是京都,也许是武汉街巷,也许是阳台植物,也许只是一些咖啡、窗外、桌面和路上的碎片。素材库已经开始有秩序了,接下来就该让这些画面重新动起来。

2元你买不到吃亏、6元买不到上当!