当手机遇上可携式电子,两个不同的音讯世界产生了冲突。这么多年过去,模拟工程师仍旧竭力打造可以完美处理语音、音乐播放和铃声的解决方案。本文将检视当前的技术进展,并探讨智能型手机的音讯整合趋势。
曾经有一段时间,数字音讯很清楚地被分为Hi-Fi和通话两个部分。Hi-Fi一般意谓立体和16位分辨率,取样速率为44.1kHz,这是原始的Compact Disc规格。另一方面,电话通话则是单声道及低分辨率,一般是以8位和8kHZ数字化而成。不同型态的混合讯号IC各自适合不同的应用。Hi-Fi音讯编译码IC很快就采用多位sigma-delta技术去改善音质,同时间电话仍然是非常简单,低数据速率及低成本变换器限制了改善音质的可能性。这两种编译码芯片拥有不同的接口。市场上已出现一些针对Hi-Fi立体音响的数据格式,其中最为普及的是I2S (Inter-IC Sound)。电话语音编译码IC则通常是采用脉冲编码调变(PCM)界面。严格来说,脉冲编码调变已包含今日所使用的大部分数字格式,包括I2S;它的原始目的便是要区别数字编码和像是频率调变的模拟技术。然而,在数字通话方面,脉冲编码调变通常是指一种特定、单声道的数据格式,无法兼容于Hi-Fi立体音讯。
计算机音讯的崛起则造就了另一种接口的兴起。虽然其音质要求和存在已久的消费性音讯市场颇为类似,然而,计算机需播放以不同取样速率播放的音讯档案(特别是8kHz、44.1kHz和48kHz)。以软件转换取样速率是可行的,但是成本却太昂贵。因此最被广泛采用的AC’97标准便将此任务交给编译码芯片,造就以专属硬件执行的效率会高出许多。AC’97实际上已成为计算机音讯的产业标准。
在一开始,可携式系统仍一本初衷:随身CD、迷你光盘及MP3播放器仍采用I2S数字模拟转换器(DAC),行动电话使用脉冲编码调变,而支持音讯功能的PDA则通常具有和桌上型计算机相同的AC’97编译码。因此,毫无意外地,第一代的复合系统通常会包含在装置内部比邻分布的电话和PDA电路、具有由通讯处理器控制的脉冲编码调变音讯编译码芯片,以及和应用处理器连接的Hi-Fi立体(AC’97或I2S)编译码芯片。然而,此编译码芯片的设计并未将这两个音讯子系统的互连性考虑在内,或者仅有极少的考虑。针对此,通常会将离散式的固态开关安插至模拟讯号路径中,便会造成噪声及谐波失真,并且占据板子空间。
图1:第一代智能型手机具有两个独立的音讯子系统(语音和Hi-Fi)。除了这两个编译码芯片外,还需要其它的离散组件以进行讯号交换与混合。
整合趋势
很明显的,一个适合此应用的解决方案是备受期待。「系统单芯片」(SoC)的想法已引导一些业者将立体数字模拟转换器或编译码芯片和其它大型IC整合在一起。然而,此方法并未产出媲美专属音讯芯片的音质。电源管理和音讯IC的结合似乎牺牲了音质,因为整流器通常会将噪声注入邻近的音讯讯号电路中。将音讯整合至数字IC同样也会面临相同问题,因为真正的Hi-Fi组件通常需要以0.35微米制程针对混合讯号应用进行最佳化,然而数字逻辑已微缩至0.18微米或更小。对共存于同一芯片的这两种电路而言,若非模拟电路的效能必需有所牺牲,要不然就是整个IC会被建造于更大的几何形状上,芯片尺寸将扩大到无法被接受的程度。
扬声器放大器特别难以整合,因为它们会产生大量的热,需要散热处理。许多整合的芯片缺乏此功能,因此便不能被认为是真正的「系统单芯片」(SoC)解决方案,因为还需要一个外部的扬声器驱动IC。另一个常见的问题是模拟输入或输出不够充足,这是因为总是希望IC能越小越好。针对接脚配置在周围的正方体封装,例如QFN(方形扁平封装,无导线)封装体,会将每一边的长度延长约1mm以容纳一些额外的接脚,而如果此IC最初的体积就很大的话,这样的增加则将导致占板空间暴增。例如,从5×5mm增加至6×6mm,则占板面积会增加11mm2,而若最初为10×10mm的封装,则占板面积会增加至21mm2。
图2:整合型智能型手机编译码芯片的方块图,其拥有一颗音讯DAC、一颗立体Hi-Fi DAC和两颗ADC,被导引至脉冲编码调变或是I2S接口。
专属的音讯IC则能避免这些问题。藉由整合其它混合讯号功能,例如触控数字化以及语音和Hi-Fi编译码功能的整合,芯片总数量可以减少。在此,音讯编译码被整合至电话芯片组中,因此比较适合的应该是具有额外模拟输入、输出和内部混合的H-Fi编译码芯片。然而,即使是在此情况中,仍需用到两个编译码芯片,以容纳无线蓝牙耳机,因为许多蓝牙编译码IC皆具有脉冲编码调变接口。
音讯整合的方式有很多种。分享模拟数字转换器和数字模拟转换器可降低硬件成本,但是却会导致无法同时播放或录制两个音讯串流。针对每一功能提供专属的转换器能克服此问题并延长电池寿命,因为电话等级的音讯区块能以低于Hi-Fi功能的功耗设计。然而,这样的解决方案会增加硅芯片的成本。一般妥协的方法是采用独立的数字模拟转换器,但共同分享则模拟数字转换器。如此即使在通话中依然可以播放音讯(例如:在通化中同时听到第二通来电的铃声或是音乐),但是在通话时无法录音至应用处理器,这样的限制是可被接受的,因为在这样的使用情境中,使用者不可能看到这么多的价值。藉由停止通道之一的用电,且其它通道以较低的取样速率运作,可进一步降低模拟数字转换器的功耗。
图3:仅需使用三个输入接脚和一个麦克风偏压接脚便能让两个麦克风都连至编译码芯片。(52RD
频率和界面
通讯和应用电路之间的内部电路区块是可以分享的,但是接口就没办法了。这是因为每一个音讯串流都是在独立频率电路上运作,且拥有自己的频率频率。只要是这种情况,整合的智能型手机编译码芯片就同时需要脉冲编码调变接口和一个独立的I2S或AC’97连结。
在固定系统中,音讯频率通常是由石英振荡器产生。例如,AC’97便指明符合规定的编译码芯片具有一个芯片上的振荡器,其连结至一个外部的 24.576MHz(512 × 48kHz)石英,I2S则使用高出数倍的取样速率,通常其取样速率为256。然而,在智能型手机的设计中,考虑到额外的功耗、占板空间及频率石英体的成本,因此设计师多从已出现在板子上的其它频率取得Hi-Fi音讯频率。虽然此额外的频率部分需由锁相回路(PLL)实现,但是此解决方案仍较外加的石英振荡器受到欢迎,因为低功率、低噪声的锁相回路能以极低的价格被整合至混合讯号IC中。相同的情况也适用于其它子系统可能需要的频率,例如支持视讯的 MPEG译码器的标准27MHz频率。针对I2S,不同的取样速率需要不同的频率频率,藉由简单地将word clock LPCLK(其频率为取样速率)乘以256或任何其它固定数字,锁相回路能在任何情况中提供正确的频率。因此组件供应者也倾向将一或两个锁相回路整合至他们智能型手机的编译码芯片中。
图4. 典型立体双耳式耳机的内部布线,以及插座插入侦测、麦克风和钩键开关侦测的机制。
麦克风
在智能型手机中,许多最困难的设计问题都和麦克风有关。其中通常必需考虑至少两个麦克风:内建(内部)麦克风和做为耳机一部份的外接麦克风。其它更多内部麦克风的存在可能是为了要消除噪声或是立体声录音,而免持式汽车套件则可能会连接外接麦克风。除了电话通话外,这些麦克风也能在应用处理器的控制下被用来录制语音备忘,或甚至是视讯片段的音轨。
为完全避免芯片外的切换,智能型手机编译码芯片必需提供充足的输入,最好是能有可独立调整的增益及弹性的路径,以涵括所有的使用情境。除录音之外,也应提供「侧音」功能。这便为模拟输出增加了一个微弱版本的麦克风讯号,因此使用耳机拨打电话的人可以听见自己的声音。当耳机插入或未连结时,插入侦测可以实现内部至外接麦克风间的无缝切换。
噪声是另一个普遍的考虑。电路的高频和数字部分会产生干扰,此干扰的产生是来自PCB线路带有麦克风讯号所致,且此干扰会由芯片上前置放大器放大。为避免此问题,谨慎的PCB布局是关键重要的因素,差异化的麦克风输入是另一个有效的对策。然而,不同的输入有它们自己的布局需求:两组PCB线路必需以平行或是相邻的方式运作,所以其中一组线路拾起的任何噪声,也会出现在另一组线路中,因此必需在麦克风放大器中加以消除。
降噪是另一个独立的问题,需要两个麦克风解决;一个拾起带有背景噪声的喇叭语音,另一个则仅拾起有背景噪声。若只在模拟电路进行简单的消除,通常无法产生令人满意的结果,这是因为根据噪声发出的方向,这两种噪声讯号的相位和幅度都会有所不同。在此需要进行数字讯号处理。然而,编译码芯片必需藉由数字化这两种麦克风讯号来执行此任务。
另一种噪音发生于在户外使用时,亦即风切噪音,其大部分被限制在200Hz的频率以下,因此能以高通滤波器消除部分的噪音。最简单的解决方案便是在麦克风输入采用较小的耦合电容器。然而,这将让麦克风无法被用在室内的音乐录音,造成没有低音部分。因此针对双用途的麦克风而言,此滤波非必要。附带一提,大部分的音讯模拟数字转换器已具备内建高通滤波器,以消除来自数字讯号的DC偏压。IC业者已针对行动应用将此特性客制化,其方法为让角频(corner frequency)成为一种选择,一些Hz为提供Hi-Fi之用途,另一些介于100Hz和200Hz的频率则是针对支持风切滤波的语音。理所当然地,模拟和数字滤波也能结合以创造更高阶的滤波特性。
头戴式耳机(Headphone)和双耳式耳机(Headset)
处理行动电话的双耳式耳机也需要特别的模拟电路。最显而易见的首要任务便是在双耳式耳机插入时,要重新规划来自单耳耳机或其它扬声器输出讯号的路径。虽然具有整合型机械开关的插口能实现此目的,但是它们通常笨重又昂贵。再者,使用于扬声器的讯号层级可能并不适用于双耳式耳机。针对单耳耳机、扬声器和双耳式耳机提供独立模拟输出,具有独立的音量控制便能解决此问题,并可允许采用较简单的插口。虽然仍需要一个机械式开关,但是只要单柱、单掷型态,一端连至接地接脚的开关就已足够了,所以此插口仅需一个外部接脚。然而,在多媒体电话中,此开关的启动并不一定就是因为双耳式耳机的插入;插在标准尺寸插口中的,可能只是没有包含麦克风在内的头戴式耳机。因此,麦克风的存在与否应分开侦测。对电子式麦克风而言,可以藉由感测麦克风的偏压电流而实现此目的,若没有电流流动,则代表没有麦克风插入。相反地,一个大而不寻常的偏压电流也是很明显的:为避免增加其它的接触至标准头戴式耳机或双耳式耳机插座,在双耳式耳机上用来接收来电的按钮(所谓的钩键开关)通常会让麦克风短路。结果,偏压电流增加,指出此钩键开关已被按压。藉由在芯片上麦克风偏压电路中增加一个电流传感器,智能型手机编译码芯片能侦测这两种情况,并自动针对个别情况采取正确的动作。
扬声器
行动电话中的扬声器数目和输出功率在最近不断膨胀。然而在1990年代,单边耳机才是王道,现代的掀盖式手机配备了内部和外部喇叭,如此无论手机是打开或是合起,都能播放音乐。支持立体铃声需要两个外部扬声器,而普遍的免持功能则在小型单耳耳机之外还需要另一个就行动电话标准而言「大型」扬声器。如同麦克风一般,为每一扬声器提供专属的模拟输出能带来许多芯片外切换(off-chip switching)所没有的好处,由于扬声器放大器会用掉庞大的供应电流,因此在未启动时降低功耗便成为十分重要的事。行动电话编译码芯片提供越来越多的细部电源管理,能个别启动或关掉每一个输出,以避免任何没有必要的电池电力浪费。再者,现有电源管理解决方案中的稳压器通常无法提供驱动扬声器音量全开所需的电流。编译码芯片供应业者已针对此问题提出因应之道,他们设计让芯片上扬声器放大器直接利用电池的电压运作(一般是锂离子电池的4.2V),而非调整过后的供应电压。一般而言,虽然这种作法并无法节省电力,此扬声器放大器会消耗原本是由稳压器消耗的电力,但是却能除去增加一个稳压器的需求。
铃声
在过去几年间,铃声的复杂性稳定地增加,从只有连续单音到多音旋律,一直到最后的WAV和MP3音乐片段,几乎任何声音都能以立体声生成。乐器数码接口(Musical Instrument Digital Interface;MIDI)已成为音乐铃声的标准,且有一些业者已开发适用此新应用的低功率MIDI芯片。将此IC整合至音讯子系统需要在编译码芯片上增加额外的模拟输入。此额外的输入对连接FM radio IC、增加其它功能至多媒体封装中也很有用。MIDI音调生成当然也能被整合至编译码芯片中,然而,一般倾向将自己想要的铃声储存为音讯档案,并透过现有的Hi-Fi数字模拟转换器播放出来,因此对于未拥有相关IP硅智财的IC业者而言,此诉求便不具有太大的吸引力。
未来的发展
所以未来智能型手机音讯的发展会是如何?现今比较受到瞩目的数字音讯趋势包括从立体声进展至多声道环绕音响格式,且可能会采用最近发表、用于大部分PC和笔记型计算机中的“Azalia” Intel超传真音讯(Intel High Definition Audio)标准。就在不久之前,还有不少人嘲笑将立体扬声器放进行动电话的点子,但是如今的市场实情却证明他们错了。同样地,Azalia的新特性现在也尚无法合理化它那高于AC’97的成本和功耗。I2S和AC’97的争战仍在继续中,有些设计师比较喜欢较不复杂的I2S,另外一些则偏爱AC’97提供的较低接脚数,以及能轻易处理不同的取样速率。就像现在用于智能型手机中的许多低功耗CPU皆提供双重标准的音讯接口,以满足不同阵营的需求,这两种标准可能会继续并存。相反地,设计一个支持两种标准的编译码芯片则是困难许多,因为AC’97的VRA(可调速率音讯)需要不同于I2S的频率技术,以及大量的额外数字电路。
将应用和通讯处理器成功整合至单一数字装置上,并使用单一音讯频率,将使语音和Hi-Fi音讯接口的结合成为可能,而且之后可能会转变为过去那种较不复杂的编译码芯片。但是就现在而言,IC业者正致力于将其它现有混合讯号组件整合至他们的音讯编译码芯片中,包括触控功能、稳压器和电源管理。已经准备好的整合型影像解决方案到目前为止仍无法将音讯和和摄影机或视讯功能整合在一起,不过这并非绝对的事实。在此同时,音讯功能不断增加,例如3D强化、图形均衡器和动态压缩等,且音质、功耗和封装尺寸也有长足的进展。