sketch-man/claude-skill-auto-subtitles
Auto-burn voice-driven subtitles into any video. Whisper transcribes with word timestamps, smart-chunks into 2-5 word semantic blocks, ffmpeg burns into video with your font and brand plate. Claude Code skill.
Queima automaticamente legendas acionadas por voz em qualquer vídeo. Usa Whisper para transcrição com timestamps por palavra, agrupa blocos semânticos de 2 a 5 palavras e utiliza ffmpeg para inserir as legendas com sua fonte e placa de marca. Skill para Claude Code.
npx skills add sketch-man/claude-skill-auto-subtitlesEsta skill para Claude Code automatiza o processo de adicionar legendas em vídeos baseadas na transcrição de áudio. Ela utiliza o modelo Whisper para transcrever a fala com timestamps precisos para cada palavra, garantindo sincronia com o vídeo. Em seguida, a ferramenta agrupa inteligentemente as palavras em blocos semânticos de 2 a 5 palavras, melhorando a legibilidade e o fluxo natural da legenda. Por fim, o ffmpeg é usado para queimar essas legendas diretamente no vídeo, permitindo personalização de fonte e inclusão de uma placa de marca (brand plate). É útil para criadores de conteúdo, editores de vídeo e desenvolvedores que desejam gerar legendas de forma rápida e automática sem sair do ambiente de linha de comando do Claude Code, suportando qualquer vídeo com áudio em que o Whisper consiga transcrever a fala.
Auto-burn voice-driven subtitles into any video. Whisper transcribes with word timestamps, smart-chunks into 2-5 word semantic blocks, ffmpeg burns into video with your font and brand plate. Claude Code skill.
Get a second opinion from Google's Gemini, with a Claude Code skill wrapper. Conversation history, photo/video/audio attachments.
Lip-sync a face to a specific audio track on RunComfy via the `runcomfy` CLI. Routes across ByteDance OmniHuman (audio-driven full-body avatar from a portrait + audio), Sync Labs sync v2 / Pro (state-of-the-art mouth sync onto a video), Kling lipsync (audio-to- video and text-to-video with synced speech), and Creatify lipsync. The skill picks the right endpoint for the user's actual intent — portrait still + audio (avatar-style), source video + audio (mouth- swap on existing footage), or generate-and-sync from a script. Triggers on "lip sync", "lipsync", "make this video speak", "match audio to mouth", "dub video", "sync lips to voice", "Sync Labs", "voiceover sync", or any explicit ask to drive a face's mouth from an audio track.
Toolkit for creating animated GIFs optimized for Slack, with validators for size constraints and composable animation primitives. This skill applies when users request animated GIFs or emoji animations for Slack from descriptions like "make me a GIF for Slack of X doing Y".
Claude Code skill: 2 AI images → 7s video (lumalabs.ai or Kling 3.0) → GSAP scroll-scrub hero in Next.js
Make 5 TikTok-ready hook videos with one fal.ai key. A Claude Code skill by ClipsPal.
CutSense - AI Video Understanding & Programmatic Editing Engine