فرمت MPEG

 

آشنایی با فرمت MPEG

MPEG

( Moving Picture Experts Group )

مجموعه ای از استانداردها را برای فشرده سازی سیگنالهای صدا و ویدئوی متحرک با استفاد از فشرده سازی DCT تعریف نموده است که یک زبان مشترک جهانی را برای ویدئوی دیجیتال با کیفیت بالا فراهم می نماید . این استانداردها برای فشرده سازی فریمهای متوالی فرمتهای MPEG ، نامتقارن هستند ( به این معنی که فشرده سازی یک فریم بیشتر از بسط آن طول می کشد) و برای کاهش اندازه فایل به قدرت محاسباتی بالائی نیاز دارند . با اینحال ، نتیجه کار بسیار چشمگیر است .
MPEG-1 ( با استاندارد کتاب سفید ) طراحی شده بود تا ویدیوی با کیفیتVHS   را به یک نرخ داده ثابت 5/1 مگا بیت بر ثانیه ای برساند تا امکان پخش آن از یک CD معمولی بوجود آید ( برای فرمت VCD که کم و بیش از بین رفته است) این استاندارد که در سال 1993 منتشر شد از کدگذاری ویدئو در نرخ بیتهایی تا حدود 5/1 مگا بیت بر ثانیه و صدای استریوی با کیفیت 192 کیلو بیت بر ثانیه پشتیبانی کرده ، وضوح 352x240 را با سرعت 30 فریم در ثانیه و با مقیاس دهی شده و درونیابی ( Interpolate ) میگردد. مقیاس دهی باعث ایجاد یک ظاهر شطرنجی می شود. زیرا پس این فرآیند یک پیکسل به چهار پیکسل با مقدار رنگ یکسان تبدیل می شود ، که اکثر کارتهای گرافیکی می توانند تصویر را برای پخش تمام صفحه مقیاس دهی نمایند ؛ با این حال ، پخش نیم صفحه ای صرفا نرم افزاری یک مصالحه مفید است . MPEG-1 امکان ذخیره سازی 70 دقیقه صدا و ویدئو با کیفیت مناسب را بر روی یک دیسک CD منفرد بوجود می آورد، پیش از معرفی کامپیوترهای مبتنی بر پنتیوم ، MPEG-1 به پشتیبانی سخت افزاری اختصاصی احتیاج داشت.
- در طول سال 1990 ، گروه MPEG نیاز به یک استاندارد مرتبط ثانویه برای کدگذاری ویدئو در نرخ داده های بالاتر و در یک فرمت Interlaced را تشخیص داد. استاندارد MPEG-2 حاصله ، قادر به کدگذاری تلویزیون با تعریف استاندارد (SDTV  ) در نرخ بیتهایی از حدود 5/1 مگا بیت بر ثانیه تا 15 مگابیت  بر ثانیه است . MPEG-2 همچنین گزینه کدگذاری صدای فراگیر چند کاناله را اضافه کرده و با MPEG-1 سازگار است جالب است به این نکته اشاره کنیم که برای سیگنالهای ویدیویی که با نرخی پائینتر از 2 مگا بیت بر ثانیه کدگذاری شده اند  MPEG-1 کارآمدتر از MPEG-2 است. MPEG-2 دارای وضوح 480 * 720 با سرعت 30 فریم در ثانیه است ( 4 برابر بیشتر از MPEG-1) و برای کاربردهای سرگرمی و پخش با نیازهای بالاتر نظیر پخش ماهواره ای و DVD Video  بهینه سازی شده است . با نرخ داده ای در حدود 10 مگا بیت بر ثانیه ، DVD-Video  قادر است ویدیوی با کیفیت نزدیک به Broadcast  را با 5 کانال صدا تحویل دهد. وضوح آن تقریبا دو برابر نوار ویدیویی VHS است و این استاندارد از ویژگیهای بیشتری نظیر مقیاس پذیری و توانایی قرار دادن تصاویر در داخل تصاویر ، پشتیبانی می کند .
MPEG-3- که برای تلویزیون با تعاریف بالا ( HDTV ) در نظر گرفه شده بود که با MPEG-2 ادغام شد .
-در سال 1993 ، کار بر روی MPEG-4 آغاز شد ، یک فرمت چند رسانه ای با پهنای باند پائین مشابه با Quick Time که می توانست حاوی ترکیبی از رسانه ها باشد  و به ویدیوها و اصوات ضبط شده امکان می داد تا با همانندها خود که توسط کامپیوترها ایجاد شده بودند ، همزیستی داشته باشند. مهمتر اینکه MPEG-4 شیوه های استاندارد شده ای را برای نمایش واحدهایی از مضامین شنیداری ، بصری و یا صوتی – تصویری بصورت آبجکتها می توانند منشا طبیعی و یا مصنوعی داشته باشند ، به این معنی که مثلا می توانید آنها را با دوربین فیلمبرداری یا میکروفون ضبط کرده و یا با کامپیوتر ایجاد نمائید . احتمالا بزرگترین پیشرفت بوجود آمده در MPEG-4 این است که به تماشاچیان و مستمعین اجازه می دهد با اشیا داخل یک صحنه تعامل داشته باشند.
ویدئو MPEG به پهنای باند کمتری در مقایسه با M-JPEG نیاز دارد . زیرا دو قالب فشرده سازی شده هستند . این تکنیک با استفاده از فشرده سازی درون فریمی ( Intraframe ) یا فضائی ( Spatial ) ، اطلاعات اضافی داخل فریم از ویدئو را حذف می کند . MPEG  نیز همین کاررا انجام می دهد ، اما از فرآیند دیگری با نام فشرده سازی بین فریمی ( Inter frame ) یا زمانی ( Temporal ) نیز استفاده می کند . این شیوه ، اطلاعات اضافی بین فریمهای ویدیویی را حذف می نماید . اگر دو فریم متوالی از ویدیو را انتخاب کنید ، متوجه خواهید شد که در یک بیست و پنجم ثانیه ، تغییرات بسیار اندکی بوجود می آید . به این ترتیب ، MPEG نرخ فریم را با ضبط تغییرات به جای فریمهای کامل ، کاهش می دهد.
جریانهای ویدیویی MPEG یک رشته از مجموعه فریمها هستند که تحت عنوان GOP ( گروه تصاویر ) شناخته می شوند . هر گروه که معمولا بین 8 تا 24 فریم طول دارد ، تنها دارای یک فریم کامل است که تماما نمایش داده می شود . این فریم  درست شبیه یک تصویر JPEG بوده و تحت عنوان فریم 1 شناخته می شود . در اطراف این فریم ، فریمهای فشرده دیگری قرار گرفته اند که تنها بیانگر تغییرات هستند . در طول کدگذاری ، تکنیکهای پیش بینی حرکت قدرتمندی ، فریمهای مجاور را مقایسه کرده و نواحی متحرک را مشخص می کنند ، سپس بردارهائی را برای نحوه انجام هر یک از این حرکات از یک فریم به فریم بعدی تعریف می نمایند . با ضبط فقط این بردارها ، داده هایی که باید ذخیره شوند به میزان چشمگیری کاهش خواهند یافت . فریمهای P فقط به فریم پیش از خود اشاره می کنند ، در حالیکه فریمهای B به فریمهای قبل و بعد از خود تکیه دارند.