كيفية نسخ مرفقات الصوت والفيديو في Gmail

تتيح لك الوظيفة الإضافية Save Gmail to Google Drive تنزيل رسائل البريد الإلكتروني ومرفقات الملفات تلقائيًا من Gmail إلى Google Drive. يمكنك حفظ رسائل البريد الإلكتروني بصيغة PDF بينما يتم حفظ المرفقات بتنسيقها الأصلي.
نسخ مرفقات Gmail
يضيف أحدث إصدار من وظيفة Gmail الإضافية دعمًا لنسخ مرفقات الصوت والفيديو في رسائل Gmail. يتم النسخ بمساعدة Whisper API الخاص بـ OpenAI ويتم حفظ النص كملف نصي جديد في Google Drive.
فيما يلي دليل خطوة بخطوة حول كيفية تحويل مرفقات الصوت والفيديو في رسائل Gmail إلى نص.
الخطوة 1. قم بتثبيت الوظيفة الإضافية Save Gmail to Google Drive من سوق Google Workspace. افتح Sheets.new لإنشاء ورقة Google جديدة. انتقل إلى قائمة الامتداد > حفظ رسائل البريد الإلكتروني > فتح التطبيق لتشغيل الوظيفة الإضافية.
الخطوة 2. قم بإنشاء سير عمل جديد وحدد معايير بحث Gmail. ستقوم الوظيفة الإضافية بفحص رسالة البريد الإلكتروني المطابقة بحثًا عن أي ملفات صوت وفيديو.
تدعم واجهة برمجة تطبيقات تحويل الكلام إلى نص الخاصة بـ OpenAI مجموعة واسعة من تنسيقات الصوت والفيديو بما في ذلك MP3 وWAV وMP4 وMPEG وWEBM. الحد الأقصى لحجم الملف هو 25 ميغابايت وستظل دائمًا ضمن هذا الحد نظرًا لأن Gmail لا يسمح لك بإرسال أو استقبال ملفات يزيد حجمها عن 25 ميغابايت.
الخطوة 3. في الشاشة التالية، حدد الخيار الذي يقول حفظ مرفقات الصوت والفيديو كنص واختر تنسيق الملف، نصًا أو PDF، الذي ترغب في حفظ النص فيه.
يمكنك تضمين علامات في اسم الملف. على سبيل المثال، إذا قمت بتحديد اسم الملف كـ {{Subject}} {{Sender Email}}
، ستقوم الوظيفة الإضافية باستبدال العلامات بالبريد الإلكتروني الفعلي للمرسل وموضوع البريد الإلكتروني.
ستحتاج أيضًا إلى تحديد مفتاح OpenAI API الذي يمكنك الحصول عليه من لوحة معلومات OpenAI. يتقاضى OpenAI منك 0.006 دولارًا أمريكيًا لكل دقيقة من الصوت أو الفيديو المكتوب، مقربًا إلى أقرب ثانية.
احفظ سير العمل وسيتم تشغيله تلقائيًا في الخلفية، حيث يقوم بنسخ الرسائل فور وصولها إلى صندوق الوارد الخاص بك. يمكنك التحقق من حالة سير العمل في ورقة Google نفسها.
انظر أيضًا: تحويل الكلام إلى نص باستخدام Dictation.io
تحويل الكلام إلى نص باستخدام Google Apps Script
داخليًا، تستخدم الوظيفة الإضافية Google Apps Script للاتصال بـ OpenAI API ونسخ ملفات الصوت والفيديو. إليك الكود المصدري لبرنامج Google Script الذي يمكنك نسخه واستخدامه في مشاريعك الخاصة.
// Define the URL for the OpenAI audio transcription API
const WHISPER_API_URL = 'https://api.openai.com/v1/audio/transcriptions';
// Define your OpenAI API key
const OPENAI_API_KEY = 'sk-putyourownkeyhere';
// Define a function that takes an audio file ID and language as parameters
const transcribeAudio = (fileId, language) => {
// Get the audio file as a blob using the Google Drive API
const audioBlob = DriveApp.getFileById(fileId).getBlob();
// Send a POST request to the OpenAI API with the audio file
const response = UrlFetchApp.fetch(WHISPER_API_URL, {
method: 'POST',
headers: {
Authorization: `Bearer ${OPENAI_API_KEY}`
},
payload: {
model: 'whisper-1',
file: audioBlob,
response_format: 'text',
language: language
}
});
// Get the transcription from the API response and log it to the console
const data = response.getContentText();
Logger.log(data.trim());
};
يرجى استبدال قيمة OPENAI_API_KEY بمفتاح OpenAI API الخاص بك. تأكد أيضًا من تخزين ملف الصوت أو الفيديو الذي تريد نسخه في Google Drive وأن لديك على الأقل أذونات عرض (قراءة) الملف.
نسخ ملفات الصوت والفيديو الكبيرة
تقبل Whisper API فقط الملفات الصوتية التي يقل حجمها عن 25 ميغابايت. إذا كان لديك ملف أكبر، يمكنك استخدام Pydub
حزمة Python لتقسيم الملف الصوتي إلى أجزاء أصغر ثم إرسالها إلى واجهة برمجة التطبيقات للنسخ.
إذا كان حجم ملف الفيديو كبيرًا، فيمكنك استخراج المسار الصوتي من ملف الفيديو باستخدام FFmpeg وإرساله إلى واجهة برمجة التطبيقات للنسخ.
# Extract the audio from video
ffmpeg -i video.mp4 -vn -ab 256 audio.mp3
## Split the audio file into smaller chunks
ffmpeg -i large_audio.mp3 -f segment -segment_time 60 -c copy output_%03d.mp3
سوف يقوم FFmpeg بتقسيم ملف الصوت المدخل إلى أجزاء متعددة مدتها 60 ثانية، ويسميها باسمput_001.mp3، وoutput_002.mp3، وما إلى ذلك، اعتمادًا على مدة ملف الإدخال.