sketch-man/claude-skill-auto-subtitles

Queima automaticamente legendas acionadas por voz em qualquer vídeo. Usa Whisper para transcrição com timestamps por palavra, agrupa blocos semânticos de 2 a 5 palavras e utiliza ffmpeg para inserir as legendas com sua fonte e placa de marca. Skill para Claude Code.

Funciona com✓Claude Code~Codex CLI~Cursor

npx skills add sketch-man/claude-skill-auto-subtitles

Ver original→Navegar por todas as habilidades

AI Overview & Summary

Esta skill para Claude Code automatiza o processo de adicionar legendas em vídeos baseadas na transcrição de áudio. Ela utiliza o modelo Whisper para transcrever a fala com timestamps precisos para cada palavra, garantindo sincronia com o vídeo. Em seguida, a ferramenta agrupa inteligentemente as palavras em blocos semânticos de 2 a 5 palavras, melhorando a legibilidade e o fluxo natural da legenda. Por fim, o ffmpeg é usado para queimar essas legendas diretamente no vídeo, permitindo personalização de fonte e inclusão de uma placa de marca (brand plate). É útil para criadores de conteúdo, editores de vídeo e desenvolvedores que desejam gerar legendas de forma rápida e automática sem sair do ambiente de linha de comando do Claude Code, suportando qualquer vídeo com áudio em que o Whisper consiga transcrever a fala.

Ask in your favorite AI

Open a new chat with this agent skill pre-loaded.

ChatGPT Claude Gemini Grok Perplexity DeepSeek

Documentação

sketch-man/claude-skill-auto-subtitles

Auto-burn voice-driven subtitles into any video. Whisper transcribes with word timestamps, smart-chunks into 2-5 word semantic blocks, ffmpeg burns into video with your font and brand plate. Claude Code skill.

Habilidades Relacionadas

akostibas/ask-gemini-skill

Get a second opinion from Google's Gemini, with a Claude Code skill wrapper. Conversation history, photo/video/audio attachments.

community

agentspace-so/lipsync

Lip-sync a face to a specific audio track on RunComfy via the `runcomfy` CLI. Routes across ByteDance OmniHuman (audio-driven full-body avatar from a portrait + audio), Sync Labs sync v2 / Pro (state-of-the-art mouth sync onto a video), Kling lipsync (audio-to- video and text-to-video with synced speech), and Creatify lipsync. The skill picks the right endpoint for the user's actual intent — portrait still + audio (avatar-style), source video + audio (mouth- swap on existing footage), or generate-and-sync from a script. Triggers on "lip sync", "lipsync", "make this video speak", "match audio to mouth", "dub video", "sync lips to voice", "Sync Labs", "voiceover sync", or any explicit ask to drive a face's mouth from an audio track.

community

composiohq/slack-gif-creator

Toolkit for creating animated GIFs optimized for Slack, with validators for size constraints and composable animation primitives. This skill applies when users request animated GIFs or emoji animations for Slack from descriptions like "make me a GIF for Slack of X doing Y".

community

← More Vídeo e Animação skills

sketch-man/claude-skill-auto-subtitles

Ask in your favorite AI

Documentação

sketch-man/claude-skill-auto-subtitles

Habilidades Relacionadas

akostibas/ask-gemini-skill

agentspace-so/lipsync

composiohq/slack-gif-creator

sergeyramas/scroll-scrub-hero-skill

Kronop/clipspal-hooks-skill

kivimedia/watch-video-skill