Auto-Untertitel für Videos (Whisper + ffmpeg)

Brennt automatisch sprachgesteuerte Untertitel in jedes Video ein. Nutzt Whisper für die Transkription mit Wort-Zeitstempeln, zerlegt den Text intelligent in semantische Blöcke von 2-5 Wörtern und brennt die Untertitel mit ffmpeg in das Video ein – inklusive eigener Schriftart und Brand-Platte.

Funktioniert mit✓Claude Code~Codex CLI~Cursor

npx skills add sketch-man/claude-skill-auto-subtitles

Original anzeigen→Alle Skills durchsuchen

AI Overview & Summary

Dieses Skill automatisiert die Erstellung und Einbettung von Untertiteln in Videos. Es nutzt OpenAIs Whisper-Modell, um Sprache zu transkribieren und für jedes Wort einen genauen Zeitstempel zu ermitteln. Anschließend werden die Wörter intelligent in semantisch sinnvolle Blöcke von 2-5 Wörtern gruppiert, was die Lesbarkeit im Vergleich zu Einzelwort-Untertiteln deutlich verbessert. Die eigentliche Einbettung erfolgt über ffmpeg, wobei du sowohl die Schriftart als auch ein individuelles Markenlogo (Brand Plate) einbinden kannst. Das Skill ist als Claude Code Skill konzipiert und eignet sich für Entwickler, Content Creator und alle, die schnell und präzise Untertitel in Videos einfügen möchten – ohne manuelle Bearbeitung. Es vereinfacht den Workflow von der Audio-Transkription bis zum fertigen, untertitelten Video in einem Durchlauf.

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

Dokumentation

sketch-man/claude-skill-auto-subtitles

Auto-burn voice-driven subtitles into any video. Whisper transcribes with word timestamps, smart-chunks into 2-5 word semantic blocks, ffmpeg burns into video with your font and brand plate. Claude Code skill.

Verwandte Skills

xiaoyiv/douyin

Download Douyin (抖音) videos. Use when user wants to: (1) download Douyin videos, (2) get video info (title, author, stats). Supports short links (v.douyin.com) and full URLs.

community

conardli/web-video-presentation

把一篇文章或口播稿，做成"看起来像视频"的点击驱动 16:9 网页演示，可选合成口播音频。流程：原始文章 → **一次产出**口播稿 + outline 开发计划 → 用户**一次对齐** 5 件事（稿子 / outline / 主题 / 素材 / 开发模式）→ 网页开发（逐章 / 顺序 / 并行）→ 可选音频合成（provider-agnostic：内置 MiniMax mmx-cli + OpenAI TTS，可换 ElevenLabs / edge-tts / Azure / 自带 TTS）。**outline 只规划节奏与信息密度，不规划动画** —— 动画由章节开发时按 PRINCIPLES + ANTI-AI 法则即时设计。每次点击推进口播稿的一个节拍，每一步独占整屏，进度条平时隐藏只在悬浮时出现。适用场景：用网页做视频（动态 PPT 但不像 PPT）、把口播稿 / 文章变成可交互的解说、为 B 站 / YouTube / 视频号录屏教程、做有电影感的产品 / talk demo。本 Skill 沉淀的是设计方法论 + 协作流程 —— 不绑定任何特定样式 / 字体 / 颜色 —— 因此能复用到任意主题与美学。

community

← More Video & Animation skills

Auto-Untertitel für Videos (Whisper + ffmpeg)

Ask in your favorite AI

Dokumentation

sketch-man/claude-skill-auto-subtitles

Verwandte Skills

xiaoyiv/douyin

conardli/web-video-presentation

metiu1/tube-assistant

Anshuman-Tripathi-minato/Portfolio

remotion-dev/web-renderer-test

banodoco/hivemind