百科解釋
目錄·WAV簡介·WAV剖析·WAV特點·WAV支持·WAV轉(zhuǎn)換·編解碼器·VB中WAV WAV簡介 WAV為微軟公司(Microsoft)開發(fā)的一種聲音文件格式,它符合RIFF(Resource Interchange File Format)文件規(guī)范,用于保存Windows平臺的音頻信息資源,被Windows平臺及其應(yīng)用程序所廣泛支持,該格式也支持MSADPCM,CCITT A LAW等多種壓縮運算法,支持多種音頻數(shù)字,取樣頻率和聲道,標準格式化的WAV文件和CD格式一樣,也是44.1K的取樣頻率,16位量化數(shù)字,因此在聲音文件質(zhì)量和CD相差無幾! WAV打開工具是WINDOWS的媒體播放器。 通常使用三個參數(shù)來表示聲音,量化位數(shù),取樣頻率和聲道數(shù)。聲道有單聲道和立體聲之分,取樣頻率一般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三種,不過盡管音質(zhì)出色,但在壓縮后的文件體積過大!相對其他音頻格式而言是一個缺點,其文件大小的計算方式為: WAV格式文件所占容量 = (取樣頻率 X 量化位數(shù) X 聲道) X 時間 / 8 (字節(jié) = 8bit) 目前支持WAV設(shè)計的手機主要為智能手機,如索尼愛立信P910和諾基亞N90以及采用微軟OS的多普達等手機,而其它一些非智能手機的產(chǎn)品,如果宣傳支持WAV格式則多半屬于只是支持單聲道的。WAV剖析 WAVE是錄音時用的標準的WINDOWS文件格式,文件的擴展名為“WAV”,數(shù)據(jù)本身的格式為PCM或壓縮型。 WAV文件格式是一種由微軟和IBM聯(lián)合開發(fā)的用于音頻數(shù)字存儲的標準,它采用RIFF文件格式結(jié)構(gòu),非常接近于AIFF和IFF格式。符合 PIFF Resource Interchange File Format規(guī)范。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數(shù)。 WAV文件作為最經(jīng)典的Windows多媒體音頻格式,應(yīng)用非常廣泛,它使用三個參數(shù)來表示聲音:采樣位數(shù)、采樣頻率和聲道數(shù)。 聲道有單聲道和立體聲之分,采樣頻率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三種。WAV文件所占容量=(采樣頻率×采樣位數(shù)×聲道)×時間/8(1字節(jié)=8bit)。 WAV對音頻流的編碼沒有硬性規(guī)定,除了PCM之外,還有幾乎所有支持ACM規(guī)范的編碼都可以為WAV的音頻流進行編碼。多媒體應(yīng)用中使用了多種數(shù)據(jù),包括位圖、音頻數(shù)據(jù)、視頻數(shù)據(jù)以及外圍設(shè)備控制信息等。RIFF為存儲這些類型的數(shù)據(jù)提供了一種方法,RIFF文件所包含的數(shù)據(jù)類型由該文件的擴展名來標識,能以RIFF文件存儲的數(shù)據(jù)包括: 音頻視頻交錯格式數(shù)據(jù)(.AVI) 、波形格式數(shù)據(jù)(.WAV) 、位圖格式數(shù)據(jù)(.RDI) 、MIDI格式數(shù)據(jù)(.RMI) 、調(diào)色板格式(.PAL) 、多媒體電影(.RMN) 、動畫光標(.ANI) 、其它RIFF文件(.BND) 。 WAVE文件可以存儲大量格式的數(shù)據(jù),通常采用的音頻編碼方式是脈沖編碼調(diào)制(PCM)。由于WAV格式源自Windows/Intel環(huán)境,因而采用Little-Endian字節(jié)順序進行存儲。 WAVE文件作為多媒體中使用的聲波文件格式之一,它是以RIFF格式為標準的。RIFF是英文Resource Interchange File Format的縮寫,每個WAVE文件的頭四個字節(jié)便是“RIFF”。WAVE文件由文件頭和數(shù)據(jù)體兩大部分組成。其中文件頭又分為RIFF/WAV文件標識段和聲音數(shù)據(jù)格式說明段兩部分。WAVE文件各部分內(nèi)容及格式見附表。 常見的聲音文件主要有兩種,分別對應(yīng)于單聲道(11.025KHz采樣率、8Bit的采樣值)和雙聲道(44.1KHz采樣率、16Bit的采樣值)。采樣率是指:聲音信號在“!鷶(shù)”轉(zhuǎn)換過程中單位時間內(nèi)采樣的次數(shù)。采樣值是指每一次采樣周期內(nèi)聲音模擬信號的積分值。 對于單聲道聲音文件,采樣數(shù)據(jù)為八位的短整數(shù)(short int 00H-FFH);而對于雙聲道立體聲聲音文件,每次采樣數(shù)據(jù)為一個16位的整數(shù)(int),高八位和低八位分別代表左右兩個聲道。 WAVE文件數(shù)據(jù)塊包含以脈沖編碼調(diào)制(PCM)格式表示的樣本。WAVE文件是由樣本組織而成的。在單聲道WAVE文件中,聲道0代表左聲道,聲道1代表右聲道。在多聲道WAVE文件中,樣本是交替出現(xiàn)的。 WAVE文件的每個樣本值包含在一個整數(shù)i中,i的長度為容納指定樣本長度所需的最小字節(jié)數(shù)。首先存儲低有效字節(jié),表示樣本幅度的位放在i的高有效位上,剩下的位置為0,這樣8位和16位的PCM波形樣本的數(shù)據(jù)格式。 WAVE文件作為多媒體中使用的聲波文件格式之一,它是以RIFF格式為標準的。 RIFF是英文Resource Interchange File Format的縮寫,每個WAVE文件的頭四個 字節(jié)便是“RIFF”。 WAVE文件是由若干個Chunk組成的。按照在文件中的出現(xiàn)位置包括:RIFF WAVE Chunk, Format Chunk, Fact Chunk(可選), Data Chunk。具體見下圖: ------------------------------------------------ | RIFF WAVE Chunk | | ID = 'RIFF' | | RiffType = 'WAVE' | ------------------------------------------------ | Format Chunk | | ID = 'fmt ' | ------------------------------------------------ | Fact Chunk(optional) | | ID = 'fact' | ------------------------------------------------ | Data Chunk | | ID = 'data' | ------------------------------------------------ 圖1 Wav格式包含Chunk示例 RIFF WAVE Chunk ================================== | |所占字節(jié)數(shù)| 具體內(nèi)容 | ================================== | ID | 4 Bytes | 'RIFF' | ---------------------------------- | Size | 4 Bytes | | ---------------------------------- | Type | 4 Bytes | 'WAVE' | ---------------------------------- 圖2 RIFF WAVE Chunk 以'RIFF'作為標示,然后緊跟著為size字段,該size是整個wav文件大小減去ID 和Size所占用的字節(jié)數(shù),即FileLen - 8 = Size。然后是Type字段,為'WAVE',表 示是wav文件。 結(jié)構(gòu)定義如下: struct RIFF_HEADER { char szRiffID[4]; // 'R','I','F','F' DWORD dwRiffSize; char szRiffFormat[4]; // 'W','A','V','E' }; Format Chunk ==================================================================== | | 字節(jié)數(shù) | 具體內(nèi)容 | ==================================================================== | ID | 4 Bytes | 'fmt ' | -------------------------------------------------------------------- | Size | 4 Bytes | 數(shù)值為16或18,18則最后又附加信息 | -------------------------------------------------------------------- ---- | FormatTag | 2 Bytes | 編碼方式,一般為0x0001 | | -------------------------------------------------------------------- | | Channels | 2 Bytes | 聲道數(shù)目,1--單聲道;2--雙聲道 | | -------------------------------------------------------------------- | | SamplesPerSec | 4 Bytes | 采樣頻率 | | -------------------------------------------------------------------- | | AvgBytesPerSec| 4 Bytes | 每秒所需字節(jié)數(shù) | |===> WAVE_FORMAT -------------------------------------------------------------------- | | BlockAlign | 2 Bytes | 數(shù)據(jù)塊對齊單位(每個采樣需要的字節(jié)數(shù)) | | -------------------------------------------------------------------- | | BitsPerSample | 2 Bytes | 每個采樣需要的bit數(shù) | | -------------------------------------------------------------------- | | | 2 Bytes | 附加信息(可選,通過Size來判斷有無) | | -------------------------------------------------------------------- ---- 圖3 Format Chunk 以'fmt '作為標示。一般情況下Size為16,此時最后附加信息沒有;如果為18 則最后多了2個字節(jié)的附加信息。主要由一些軟件制成的wav格式中含有該2個字節(jié)的 附加信息。 結(jié)構(gòu)定義如下: struct WAVE_FORMAT { WORD wFormatTag; WORD wChannels; DWORD dwSamplesPerSec; DWORD dwAvgBytesPerSec; WORD wBlockAlign; WORD wBitsPerSample; }; struct FMT_BLOCK { char szFmtID[4]; // 'f','m','t',' ' DWORD dwFmtSize; WAVE_FORMAT wavFormat; }; Fact Chunk ================================== | |所占字節(jié)數(shù)| 具體內(nèi)容 | ================================== | ID | 4 Bytes | 'fact' | ---------------------------------- | Size | 4 Bytes | 數(shù)值為4 | ---------------------------------- | data | 4 Bytes | | ---------------------------------- 圖4 Fact Chunk Fact Chunk是可選字段,一般當wav文件由某些軟件轉(zhuǎn)化而成,則包含該Chunk。 結(jié)構(gòu)定義如下: struct FACT_BLOCK { char szFactID[4]; // 'f','a','c','t' DWORD dwFactSize; }; Data Chunk ================================== | |所占字節(jié)數(shù)| 具體內(nèi)容 | ================================== | ID | 4 Bytes | 'data' | ---------------------------------- | Size | 4 Bytes | | ---------------------------------- | data | | | ---------------------------------- 圖5 Data Chunk Data Chunk是真正保存wav數(shù)據(jù)的地方,以'data'作為該Chunk的標示。然后是 數(shù)據(jù)的大小。緊接著就是wav數(shù)據(jù)。根據(jù)Format Chunk中的聲道數(shù)以及采樣bit數(shù), wav數(shù)據(jù)的bit位置可以分成以下幾種形式: --------------------------------------------------------------------- | 單聲道 | 取樣1 | 取樣2 | 取樣3 | 取樣4 | | |-------------------------------------------------------- | 8bit量化 | 聲道0 | 聲道0 | 聲道0 | 聲道0 | --------------------------------------------------------------------- | 雙聲道 | 取樣1 | 取樣2 | | |-------------------------------------------------------- | 8bit量化 | 聲道0(左) | 聲道1(右) | 聲道0(左) | 聲道1(右) | --------------------------------------------------------------------- | | 取樣1 | 取樣2 | | 單聲道 |-------------------------------------------------------- | 16bit量化 | 聲道0 | 聲道0 | 聲道0 | 聲道0 | | | (低位字節(jié)) | (高位字節(jié)) | (低位字節(jié)) | (高位字節(jié)) | --------------------------------------------------------------------- | | 取樣1 | | 雙聲道 |-------------------------------------------------------- | 16bit量化 | 聲道0(左) | 聲道0(左) | 聲道1(右) | 聲道1(右) | | | (低位字節(jié)) | (高位字節(jié)) | (低位字節(jié)) | (高位字節(jié)) | --------------------------------------------------------------------- 圖6 wav數(shù)據(jù)bit位置安排方式 Data Chunk頭結(jié)構(gòu)定義如下: struct DATA_BLOCK { char szDataID[4]; // 'd','a','t','a' DWORD dwDataSize; };WAV特點 WAV音頻格式的優(yōu)點包括:簡單的編/解碼(幾乎直接存儲來自模/數(shù)轉(zhuǎn)換器(ADC)的信號)、普遍的認同/支持以及無損耗存儲。WAV格式的主要缺點是需要音頻存儲空間。對于小的存儲限制或小帶寬應(yīng)用而言,這可能是一個重要的問題。WAV格式的另外一個潛在缺陷是在32位WAV文件中的2G限制,這種限制已在為SoundForge開發(fā)的W64格式中得到了改善。WAV支持 Wav格式支持MSADPCM、CCITTALaw、CCITT μ Law和其它壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但其缺點是文件體積較大(一分鐘44kHZ、16bit Stereo的WAV文件約要占用10MB左右的硬盤空間),所以不適合長時間記錄。 在Windows中,把聲音文件存儲到硬盤上的擴展名為WAV。WAV記錄的是聲音的本身,所以它占的硬盤空間大的很。例如:16位的44.1KHZ的立體聲聲音一分鐘要占用大約10MB的容量,和MIDI相比就差的很遠。WAV轉(zhuǎn)換 AVI和WAV在文件結(jié)構(gòu)上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經(jīng)常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以采用DivX編碼來壓縮視頻流,當然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示W(wǎng)AV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應(yīng)的dDecode,就可以欣賞這些WAV了。 在Windows平臺下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達到較高的音質(zhì)的要求,因此,WAV也是音樂編輯創(chuàng)作的首選格式,適合保存音樂素材。因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉(zhuǎn)換之中,例如MP3轉(zhuǎn)換成WMA。編解碼器 WAV文件格式是一種由微軟和IBM聯(lián)合開發(fā)的用于音頻數(shù)字存儲的標準,它采用RIFF文件格式結(jié)構(gòu),非常接近于AIFF和IFF格式。多媒體應(yīng)用中使用了多種數(shù)據(jù),包括位圖、音頻數(shù)據(jù)、視頻數(shù)據(jù)以及外圍設(shè)備控制信息等。RIFF為存儲這些類型的數(shù)據(jù)提供了一種方法,RIFF文件所包含的數(shù)據(jù)類型由該文件的擴展名來標識,能以RIFF文件存儲的數(shù)據(jù)包括: # 音頻視頻交錯格式數(shù)據(jù)(.AVI) # 波形格式數(shù)據(jù)(.WAV) # 位圖格式數(shù)據(jù)(.RDI) # MIDI格式數(shù)據(jù)(.RMI) # 調(diào)色板格式(.PAL) # 多媒體電影(.RMN) # 動畫光標(.ANI) # 其它RIFF文件(.BND) RIFF是一種含有嵌套數(shù)據(jù)結(jié)構(gòu)的二進制文件格式,每個數(shù)據(jù)結(jié)構(gòu)都稱為因一個chunk(塊)。Chunk在RIFF文件中沒有固定的位置,因而偏移量不能用于定位域值。一個塊中的數(shù)據(jù)包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流或其它組塊(稱為子塊)等,每個RIFF塊都具有如下結(jié)構(gòu): typedef struct _Chunk { DWORD ChunkId; /*塊標志*/ DWORD ChunkSize; /*塊大小*/ BYTE ChunkData[ChunkSize]; /*塊內(nèi)容*/ } CHUNK; ChunkId由4個ASCII字符組成,用以識別塊中所包含的數(shù)據(jù)。字符RIFF用于標識RIFF數(shù)據(jù)塊,間隔空格在右面是不超過4個字符的ID。由于這種文件結(jié)構(gòu)最初是由Microsoft和IBM為PC機所定義,RIFF文件是按照little-endian字節(jié)順序?qū)懭氲,而采用big-endian字節(jié)順序的文件則用‘RIFX’作為標志。 ChunkSize(塊大小)是存儲在ChunkData域中數(shù)據(jù)的長度,ChunkId與ChunkSize域的大小則不包括在該值內(nèi)。 ChunkData(塊內(nèi)容)中所包含的數(shù)據(jù)是以字(WORD)為單位排列的,如果數(shù)據(jù)長度是奇數(shù),則在最后添加一個空(NULL)字節(jié)。 子塊(Subchunk)與塊具有相同的結(jié)構(gòu)。一個子塊就是包含在其它塊內(nèi)部的一個塊,只有RIFF文件塊‘RIFF’和列表塊‘List’才能含有子塊,所有其它塊僅能含有數(shù)據(jù)。一個RIFF文件就是一個RIFF塊,文件中所有其它塊和子塊均包含在這個塊中。 WAV文件可以存儲大量格式的數(shù)據(jù),通常采用的音頻編碼方式是脈沖編碼調(diào)制(PCM)。由于WAV格式源自Windows/Intel環(huán)境,因而采用Little-Endian字節(jié)順序進行存儲。 脈沖編碼調(diào)制 Claude E. Shannon于1948年發(fā)表的“通信的數(shù)學(xué)理論”奠定了現(xiàn)代通信的基礎(chǔ)。同年貝爾實驗室的工程人員開發(fā)了PCM技術(shù),雖然在當時是革命性的,但今天脈沖編碼調(diào)制被視為是一種非常單純的無損耗編碼格式,音頻在固定間隔內(nèi)進行采集并量化為頻帶值,其它采用這種編碼方法的應(yīng)用包括電話和CD。PCM主要有三種方式:標準PCM、差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)DPCM。在標準PCM中,頻帶被量化為線性步長的頻帶,用于存儲絕對量值。在DPCM中存儲的是前后電流值之差,因而存儲量減少了約25%。自適應(yīng)DPCM改變了DPCM的量化步長,在給定的信造比(SNR)下可壓縮更多的信息。 共同的執(zhí)行過程 在對WAV音頻文件進行編解碼過程中,最一致的地方包括采樣點和采樣幀的處理和轉(zhuǎn)換。一個采樣點的值代表了給定時間內(nèi)的音頻信號,一個采樣幀由適當數(shù)量的采樣點組成并能構(gòu)成音頻信號的多個通道。對于立體聲信號一個采樣幀有兩個采樣點,一個采樣點對應(yīng)一個聲道。一個采樣幀作為單一的單元傳送到數(shù)/模轉(zhuǎn)換器(DAC),以確保正確的信號能同時發(fā)送到各自的通道中。VB中WAV 在多媒體軟件的開發(fā)設(shè)計中,聲音是一個相當重要的多媒體元素,優(yōu)秀的聲音設(shè)計會為多媒體軟件增色不少。而WAV格式的聲音文件是一種最常用的聲音文件格式,也最容易得到,比如通過Win 95中的“錄音機”程序,利用麥克風就可以非常簡單地錄制WAV文件。VB是一個相當經(jīng)典的多媒體開發(fā)的工具,在VB中播放WAV文件的方法主要有這樣幾種。 一、利用OLE控件 建一窗體,用鼠標選擇OLE控件,在窗體上拖出OLE區(qū)域,在圖一的窗口中選擇新建和聲音然后按確定鍵就完成了在窗口中添加OLE控件。 這樣就可以在OLE控件的ResourceDoc屬性中選擇所要播放的文件,程序運行時雙擊OLE控件即可。 在實際的程序設(shè)計當中,往往需要單擊某個圖標或按鈕來控制聲音的播放,其實現(xiàn)方法是這樣的:首先將OLE控件的VISIBLE屬性設(shè)置為FALSE,然后在圖標或按鈕的單擊事件中編寫如下的程序: Private Sub Contol_Click() OLE1.Action = 7 End Sub 二、利用MMControl控件 VB5.0提供了許多設(shè)計多媒體的控件,在PROJECT/COMPENENTS/CONTROLS中選擇MMControls 控件,窗體上就出現(xiàn)了多媒體控件對象,在這個對象上有不同的圖形功能標識,其名稱從左到右分別是Pre、Next、Play、Pause、Back、Step、Stop、Record 、Eject。 這個多媒體控件可以播放多種格式的聲音,播放WAV格式聲音文件的程序代碼 Private Sub form_load() MMControl1.DeviceType = "waveaudio" MMControl1.filename = "c:win95mediading.wav" MMControl1.Command = "open" End Sub '以下是為圖形標識Play事件編寫的代碼 Private Sub MMControl_playclick(cancel As Integer) MMControl1.Command = "play" End Sub 當運行這個程序時,MMControl控件中的Play鍵被激活,點取此按鈕即可播放ding.wav文件。 在實際的軟件設(shè)計當中,更多的情況是鼠標點擊按鈕或圖標來控制聲音的播放, 其實現(xiàn)方法是這樣的:首先將MMControl控件的VISIBLE屬性設(shè)置為FALSE,然后在圖標或按鈕的單擊事件中編寫如下的程序: Private Sub Control1_Click() MMControl1.Command = "play" End Sub 運行程序時單擊相用的按鈕或圖標,WAV文件照樣可以播放。用自行設(shè)計的按鈕或圖標取代多媒體控件中的固定按鈕,可設(shè)計出更加靈活方便的用戶界面。 三、利用VB的API函數(shù) 在窗體的DECLARATIONS(聲明)中輸入如下代碼: P rivate Declare Function sndPlaySound Lib "winmm.dll" Alias "sndPlaySoundA" (ByVal_lpszSoundName As String, ByVal uFlags As Long) As Long 'lpszSoundName是一個字符串變量,表示一個WAV格式的文件名。 'uFlags 用于設(shè)定播放狀態(tài)的各種選項。參數(shù)值為0X00時,實現(xiàn)同步播放,參數(shù)值為0X01時實現(xiàn)非同步播放。 在命令按鈕的單擊事件中輸入如下代碼: Private Sub Command1_Click() Dim plays As Long plays = sndPlaySound(“E:WINDOWSMEDIADING.WAV", &H0) End Sub 運行時單擊命令按鈕即可播放WAV文件。
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團隊博客 | 免責聲明 | 關(guān)于詞典 | 幫助