CommunityVideo & Animationgithub.com

Auto-Untertitel für Videos (Whisper + ffmpeg)

Brennt automatisch sprachgesteuerte Untertitel in jedes Video ein. Nutzt Whisper für die Transkription mit Wort-Zeitstempeln, zerlegt den Text intelligent in semantische Blöcke von 2-5 Wörtern und brennt die Untertitel mit ffmpeg in das Video ein – inklusive eigener Schriftart und Brand-Platte.

Funktioniert mitClaude Code~Codex CLI~Cursor
npx skills add sketch-man/claude-skill-auto-subtitles
AI Overview & Summary

Dieses Skill automatisiert die Erstellung und Einbettung von Untertiteln in Videos. Es nutzt OpenAIs Whisper-Modell, um Sprache zu transkribieren und für jedes Wort einen genauen Zeitstempel zu ermitteln. Anschließend werden die Wörter intelligent in semantisch sinnvolle Blöcke von 2-5 Wörtern gruppiert, was die Lesbarkeit im Vergleich zu Einzelwort-Untertiteln deutlich verbessert. Die eigentliche Einbettung erfolgt über ffmpeg, wobei du sowohl die Schriftart als auch ein individuelles Markenlogo (Brand Plate) einbinden kannst. Das Skill ist als Claude Code Skill konzipiert und eignet sich für Entwickler, Content Creator und alle, die schnell und präzise Untertitel in Videos einfügen möchten – ohne manuelle Bearbeitung. Es vereinfacht den Workflow von der Audio-Transkription bis zum fertigen, untertitelten Video in einem Durchlauf.

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

Dokumentation

sketch-man/claude-skill-auto-subtitles

Auto-burn voice-driven subtitles into any video. Whisper transcribes with word timestamps, smart-chunks into 2-5 word semantic blocks, ffmpeg burns into video with your font and brand plate. Claude Code skill.

Verwandte Skills

xiaoyiv/douyin

Download Douyin (抖音) videos. Use when user wants to: (1) download Douyin videos, (2) get video info (title, author, stats). Supports short links (v.douyin.com) and full URLs.

community

conardli/web-video-presentation

把一篇文章或口播稿,做成"看起来像视频"的点击驱动 16:9 网页演示,可选合成口播音频。流程:原始文章 → **一次产出**口播稿 + outline 开发计划 → 用户**一次对齐** 5 件事(稿子 / outline / 主题 / 素材 / 开发模式)→ 网页开发(逐章 / 顺序 / 并行)→ 可选音频合成(provider-agnostic:内置 MiniMax mmx-cli + OpenAI TTS,可换 ElevenLabs / edge-tts / Azure / 自带 TTS)。**outline 只规划节奏与信息密度,不规划动画** —— 动画由章节开发时按 PRINCIPLES + ANTI-AI 法则即时设计。每次点击推进口播稿的一个节拍,每一步独占整屏,进度条平时隐藏只在悬浮时出现。适用场景:用网页做视频(动态 PPT 但不像 PPT)、把口播稿 / 文章变成可交互的解说、为 B 站 / YouTube / 视频号录屏教程、做有电影感的产品 / talk demo。本 Skill 沉淀的是设计方法论 + 协作流程 —— 不绑定任何特定样式 / 字体 / 颜色 —— 因此能复用到任意主题与美学。

community

metiu1/tube-assistant

AI agent that runs your YouTube channel autonomously - script, TTS voice, stock clips, video editing, AI thumbnail, upload. Free tier. Telegram control.

community

Anshuman-Tripathi-minato/Portfolio

Modern, high-performance Agentic AI Portfolio featuring custom WebGL-inspired canvas backgrounds, smooth scroll-driven animations, and a terminal-themed skills interface. Built with pure HTML/CSS/JS for maximum speed and zero dependencies.

community

remotion-dev/web-renderer-test

Add a test case to the web renderer

community

banodoco/hivemind

Drop-in skill so coding agents (Claude Code / Codex) can search the Banodoco Discord message feed for video/image generation best practices.

community