Skip to content

多媒体链路实战教学

README 只保留多媒体能力边界和入口说明;需要完整命令样例、组合链路和蓝本任务时,直接看这里。

阅读顺序

  • 只想抽图:先看 snapshot / frames / keyframes / scene
  • 只想改视频:再看 trim / scale / convert / concat / remux / mute
  • 只想处理音频:再看 extract_audio / replace_audio / convert_audio / play
  • 想做完整证据链:最后看组合链路和蓝本任务

能力覆盖

类型 入口
抽帧取证 snapshot / frames / keyframes / scene
视频处理 trim / scale / convert / concat / remux / mute
音频处理 extract_audio / replace_audio / convert_audio / play
组合链路 多步串联的媒体预处理与证据链任务

常见命令

单帧截图

mind --fast "从 /path/to/demo.mp4 的第 3.5 秒抽取一张截图,并返回证据"

图片序列

mind --fast "把 /path/to/demo.mp4 从第 0 秒开始按 2fps 导出图片序列,并返回输出目录"

关键帧提取

mind --fast "从 /path/to/demo.mp4 提取关键帧,最多返回 8 张,并输出结果证据"

场景变化抽帧

mind --fast "从 /path/to/demo.mp4 按场景变化抽帧,阈值 0.35,最多保留 10 张"

视频裁剪

mind --fast "把 /path/to/demo.mp4 从第 12 秒裁到第 25 秒,并输出 mp4 片段"

视频缩放

mind --fast "把 /path/to/demo.mp4 缩放到宽 720,高度等比,并输出新视频"

视频转码

mind --fast "把 /path/to/demo.mov 转成 30fps 的 mp4,编码为 libx264,并返回结果"

视频拼接

mind --fast "根据 /path/to/list.txt 拼接多个视频片段,输出 mp4 文件"

仅换容器

mind --fast "把 /path/to/demo.mkv 仅换容器封装成 mp4,不重编码"

去音轨

mind --fast "把 /path/to/demo.mp4 去掉音轨并输出静音视频"

视频信息探测

mind --fast "探测 /path/to/demo.mp4 的视频信息,并返回时长与原始探测结果"

音轨抽取

mind --fast "从 /path/to/demo.mp4 提取音轨为 mp3,并返回输出文件"

替换音轨

mind --fast "用 /path/to/new_audio.m4a 替换 /path/to/demo.mp4 的音轨,并输出 mp4"

音频格式转换

mind --fast "把 /path/to/demo.wav 转成 16000Hz 单声道 mp3,并返回结果"

音频试听

mind --fast "播放 /path/to/demo.mp3,音量 0.8"

组合链路

录屏问题片段精简回放

mind --fast "先探测 /path/to/demo.mp4,再把第 15 秒到第 28 秒裁出来,然后从裁剪结果中提取关键帧,最多保留 6 张"

视觉证据链预处理

mind --fast "把 /path/to/demo.mp4 先缩放到宽 720,再按场景变化抽帧,最多返回 10 张结果图"

音频分离与验证

mind --fast "从 /path/to/demo.mp4 提取音轨为 wav,再转成 16000Hz 单声道 mp3,最后播放结果文件"

最佳实践

  • probe,再决定裁剪、抽帧、转码路径
  • 报告配图优先用关键帧或场景帧
  • 长视频优先 trimextract
  • 只改容器时优先 remux
  • 涉及音轨处理时,最后接一次 audio_play 做验收

星图蓝本任务

只有当你要把探测、裁剪、抽帧、抽音轨、试听串成一条完整媒体证据链时,才需要写完整蓝本。单个媒体动作直接参考上面的单项命令即可。