音訊逐字稿工具。將音訊檔案(MP3、WAV、M4A、FLAC 等)轉換為文字逐字稿,使用 Gemini API 音訊理解能力。當使用者需要將錄音、語音備忘錄或任何音訊檔案轉換為文字時使用。【必填參數】呼叫此工具時必須傳入 file_path 參數,值為音訊檔案的完整絕對路徑(例如:C:/path/to/audio.m4a)。請從使用者訊息中擷取檔案路徑後傳入。
Generate spectrograms and feature-panel visualizations from audio with the songsee CLI.
Extract frames or short clips from videos using ffmpeg.
Search GIF providers with CLI/TUI, download results, and extract stills/sheets.
QQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
Capture frames or clips from RTSP/ONVIF cameras.
Transcribe audio via OpenAI Audio Transcriptions API (Whisper).