win8 发表于 2021-1-14 15:07

【民科】使用44k采样必然得到全损音质

本帖最后由 win8 于 2021-1-15 01:39 编辑

更新整理一下思路:
0. 我的原帖观念是,声源信号频率到达采样频率(44khz)频率1/2时,采样结果就会严重失真(也就是混叠)。对不起我已经记不得这名词了而且还没让人看懂。
1. 录音时采样频率会高于44khz,并且经过ADC之前已经通过低通滤波器过滤高于20khz部分的信号。因此原贴所述的情况在录音时并不存在。
2. 但是由于用户播放的文件通常只有44khz,因此从高质量的工程文件混缩时,仍然会发生主贴所叙述的情况。
3. 在用户播放文件时,由于DAC并非按byte输出电平,而是经过滤波、插值等方式处理(参见#30 给出的链接),情况会再次发生变化,可以得到改善。
4. 通常的举例都是使用持续的正弦波进行模拟,使用适当的方法,接近奈奎斯特频率的信号也能得到完美的还原(#42 给出的视频相当棒,我需要再花一些时间去看)。但是实际在音频文件中,显然不会出现20khz的音叉响一会儿的情况。接近20khz的高频成分是和其他频率的成分混合在一起的,并且不会持续很长。因此信号如果丢失了高频的波峰的信号,我仍然觉得难以修复。

我还是希望有公司着力推更高频率的录音,不说96k88k,48也比44强嘛。
-------------------

根据采样定律,44khz有22khz的带宽,而人耳听觉范围20hz-20khz,似乎没有毛病,但是这只说明了采样能力的上限,并不能保证采集的信号有多高的信噪比。
我会用直观的图示和简易的说明来阐述为什么44khz采样远远不能满足人耳的听觉需求。


假设原信号是橙色的正弦曲线,如果每次采样都在橙色竖线位置的时刻,显然量化结果会很好。
此时信号频率F,采样频率2F——而蓝色和绿色的竖线,采样频率同样为2F
但是显而易见,如果刚好在蓝色和绿色的时刻ADC采样,进行回放会得到蓝色和绿色的波。
我们可以想象——甚至可能导致完全没有采样到波形。

暗铁 发表于 2021-1-14 15:30

人耳的辨别能力太差了,跟人眼没法比,整那么多最后都是心理安慰居多

—— 来自 samsung SM-G9650, Android 10上的 S1Next-鹅版 v2.4.4

孟沁瑶 发表于 2021-1-14 15:42

我也是民科哈,对着维基思考了一下,其实你说的这个问题也就是必须大于2倍,而不能等于2倍的原因
只要大于两倍,振幅就是可以测得的了,所以标准是44KHz而不是40KHz

bgod666 发表于 2021-1-14 16:04

求求你先学下信号与系统吧

str007 发表于 2021-1-14 16:10

liwangli1983 发表于 2021-1-14 16:11

谁说采样点必须是振幅最高点?你想想cd采样频率是固定的44.1khz,但能记录范围是(人耳有效听力)是20hz-20khz,按你这个理论,只有22.05k的声音能正确采样了,其它频率的全完了

Jet.Black 发表于 2021-1-14 16:12

思而不学则殆

ft5555 发表于 2021-1-14 16:16

asdqwe_123 发表于 2021-1-14 16:19

谁能用信号与系统给我解释下lz说的是什么JB

win8 发表于 2021-1-14 16:25

孟沁瑶 发表于 2021-1-14 15:42
我也是民科哈,对着维基思考了一下,其实你说的这个问题也就是必须大于2倍,而不能等于2倍的原因
只要大于 ...

你还是没有理解这个理论的精髓。采样频率不足导致的是再高的adc精度,也获取不到精度足够的电压信号,必然一部分峰值信号会被削掉。录音过程不是把声音转换成正弦波表达式,而是换成电压值的数据流。没有采样到就是信噪比下降,无法根据后边信号再补偿回去

テロメア 发表于 2021-1-14 16:27

意思就是小提琴比大提琴采样率高

macos 发表于 2021-1-14 16:30

win8 发表于 2021-1-14 16:32

liwangli1983 发表于 2021-1-14 16:11
谁说采样点必须是振幅最高点?你想想cd采样频率是固定的44.1khz,但能记录范围是(人耳有效听力)是20hz-20 ...

不是必须最高点,是录音可能丢掉峰值的数据,生产误差

孟沁瑶 发表于 2021-1-14 16:33

win8 发表于 2021-1-14 16:25
你还是没有理解这个理论的精髓。采样频率不足导致的是再高的adc精度,也获取不到精度足够的电压信号,必 ...

本来还想正常讨论下……您还搁这精髓……只有六楼的第一句能回答你了

Sorastlos 发表于 2021-1-14 16:33

说的是采样精度不足,转头就变成全损音质了偷换概念啊

录音行业已经普及96KHz 24bit标准录音,对应的全制作流程保持96KHz精度的hi-res制品也有
你再多吹吹全损音质大概再过十年能普及吧

win8 发表于 2021-1-14 16:35

ft5555 发表于 2021-1-14 16:16
都是绿坛 矿石坛 20年来翻来覆去嚼烂的东西,还有必要在这里重新嚼一遍吗? ...

也不是人人混绿谭矿石啊比如我就只听说过电源和线材神论没见过杠采样定律的

Realplayer 发表于 2021-1-14 16:37

我科盲,说错了不要喷我
原始信号的波形是橙色的正弦波,怎么就成了信号的频率跟正弦波波峰/波谷出现频率一样了?
一条不规则波形可以看成是由多个波形合并生成的,同时间合并后的波形有m个波峰n个波谷,合并前的多个波形频率不是要(一般的)比这个数高吗
20hz-20khz这个数指的是什么?

asdqwe_123 发表于 2021-1-14 16:37

win8 发表于 2021-1-14 16:35
也不是人人混绿谭矿石啊比如我就只听说过电源和线材神论没见过杠采样定律的 ...

你要先知道一个东西是什么然后才能说它对不对

ft5555 发表于 2021-1-14 16:38

bgod666 发表于 2021-1-14 16:50

win8 发表于 2021-1-14 16:25
你还是没有理解这个理论的精髓。采样频率不足导致的是再高的adc精度,也获取不到精度足够的电压信号,必 ...

先搞清楚采样跟量化分别是啥再来民科吧

islxyqwe 发表于 2021-1-14 16:58

不是,你看了半天采样定律,都没看到小于两个字,然后举了个频率等于二分之一采样率的例子???

—— 来自 samsung SM-G9810, Android 10上的 S1Next-鹅版 v2.3.0

bgod666 发表于 2021-1-14 17:00

islxyqwe 发表于 2021-1-14 16:58
不是,你看了半天采样定律,都没看到小于两个字,然后举了个频率等于二分之一采样率的例子???

—— 来 ...

确实吧,一个混叠扯半天我也是想不到的

martinium 发表于 2021-1-14 17:03

爱夏 发表于 2021-1-14 17:15

暗铁 发表于 2021-1-14 15:30
人耳的辨别能力太差了,跟人眼没法比,整那么多最后都是心理安慰居多

—— 来自 samsung SM-G9650, ...

显示器色彩只有8bit,斜眼

手撕寿司 发表于 2021-1-14 17:16

本帖最后由 手撕寿司 于 2021-1-14 17:23 编辑

怎么又战起来采样率了。

1. 主贴提到的“失真”发生在采集端,并非HiFi发烧友能烧到的内容;

2. 44kHz 这样的格式是为回放设计的。跟采集没关系;

3. 现代录音的采集端通常采用高采样率,高量化数方案。。混音后才压制成44kHz的。

总之,HiFi的极限是让你能听到和混音后相同的效果,关心这之前的流程并没什么乱用。与其关心怎么录音,不如关心混音师工作时耳朵堵没堵,那天心情怎么样~

爱夏 发表于 2021-1-14 17:19

1. 采样定理的适用条件
2. DAC的频率补偿
思而不学则殆

处男鉴黄师 发表于 2021-1-14 18:08

前段时间才有一帖https://bbs.saraba1st.com/2b/thread-1978815-1-1.html
钓鱼之前先搜索一下老帖子好吗

KH2841 发表于 2021-1-14 18:13

几十个回复竟然没有一个讲傅立叶变换,难道s1都只有中学文化吗?

win8 发表于 2021-1-14 18:28

手撕寿司 发表于 2021-1-14 17:16
怎么又战起来采样率了。

1. 主贴提到的“失真”发生在采集端,并非HiFi发烧友能烧到的内容;


你说的对。但是我还是疑惑,高采样率的母带压到44khz的文件内,是不是还是同样发生波峰波谷被削掉的问题?

爱夏 发表于 2021-1-14 18:36

win8 发表于 2021-1-14 18:28
你说的对。但是我还是疑惑,高采样率的母带压到44khz的文件内,是不是还是同样发生波峰波谷被削掉的问题 ...

https://www.maximintegrated.com/cn/design/technical-documents/app-notes/3/3853.html
EQUALIZING TECHNIQUES FLATTEN DAC FREQUENCY RESPONSE

唐马儒发的链接里有

手撕寿司 发表于 2021-1-14 18:40

win8 发表于 2021-1-14 18:28
你说的对。但是我还是疑惑,高采样率的母带压到44khz的文件内,是不是还是同样发生波峰波谷被削掉的问题 ...

会的~就是抽取嘛,和你画的这个意思差不多

但这一问题同样只是在接近奈奎斯特频率处更明显,即越高频越厉害。

这导出两个问题:

1. 我们录音时会不会有这么高频的信号被录进去?
答案是非常少。。。这个你可以看看自己常听的音乐的频谱,看看10kHz往上走到底有多少能量~

2.人耳对这部分失真敏感吗?
这个问题太容易抬杠了。。谁也没法否认别人金耳朵多敏感~
我只说我自己,自测很难听出来一个高频信号3dB以内的幅度变化

win8 发表于 2021-1-14 18:53

islxyqwe 发表于 2021-1-14 16:58
不是,你看了半天采样定律,都没看到小于两个字,然后举了个频率等于二分之一采样率的例子???

—— 来 ...

极限思想,也错不到哪里去。用excel模拟了44k采样20khz正弦,意思一下

bgod666 发表于 2021-1-14 19:14

win8 发表于 2021-1-14 18:28
你说的对。但是我还是疑惑,高采样率的母带压到44khz的文件内,是不是还是同样发生波峰波谷被削掉的问题 ...

先通过一个锐截止的低通滤波

bgod666 发表于 2021-1-14 19:15

win8 发表于 2021-1-14 18:53
极限思想,也错不到哪里去。用excel模拟了44k采样20khz正弦,意思一下

采样前20khz都低通滤波滤没了

dvd6 发表于 2021-1-14 21:19

不太懂,每个点记录的数据是频率,不是波形的一个点吧?

结夜野棠. 发表于 2021-1-14 21:45

dvd6 发表于 2021-1-14 21:19
不太懂,每个点记录的数据是频率,不是波形的一个点吧?

单个点是没法有频率这个量的,采样都是在时域上对幅度的采样。采样定律要求采样频率大于目标波形最高频率的2倍,楼主这样刚好两倍是不行的。而且楼主还原波形的方法也完全不对。

而且 CD 是 44kHz 不代表录音室采集的时候是 44kHz。实际录音过程中,有时候会采用远高于2倍频率的频率超采样,低通滤波之后就可以消除一定的噪音打到更好的效果。然后实际发售的时候,通过采样率转换转换为 44kHz 发售,因为根据采样定律 44kHz 足以将人能听到的音频恢复。超采样只是为了方便进一步处理,你可以理解为修照片需要 Raw 一样,卖给消费者的音频完全没有必要超过 44kHz

要完全理解这套东西需要去学《信号与系统》,看完就明白了。不想看就直接记住采样定律的结论,不要搞楼主这样的聪明

Unlight 发表于 2021-1-14 22:16

str007 发表于 2021-1-14 16:10
http://abx.digitalfeed.net/itunes.html

以上链接是 lossless vs iTunes 256kbps AAC,还有多种测试可选


你这跟楼主说的两码事。楼主说的是采样范围,不是无损。
高质量24/96有损(MQA)的听感是要好于16/44.1的无损的

lhw369 发表于 2021-1-14 22:49

为啥要跟民科对峙?信号与系统直接拍脸上完事了。另外还需要离散数学。
请民科发帖去民科吧。会找到组织的。

—— 来自 HUAWEI LIO-AN00, Android 10上的 S1Next-鹅版 v2.4.4

手撕寿司 发表于 2021-1-14 23:10

本帖最后由 手撕寿司 于 2021-1-14 23:16 编辑

怒喷一下楼上几个动辄想拿《信号与系统》拍人脸的

楼主说的是很实在的问题,【民科】标签是为了谦虚

还有提傅立叶变换,上过大学记得几个名词很厉害吗

人家在时域上提问题,你讲不明白说明本事没学到家

wuuuuuud 发表于 2021-1-14 23:35

输出之前升采样再做sinc插值就可以消除这一问题

采样定理可以认为是给出了有限带宽信号的压缩极限和压缩方法,但是你要去解压缩(复原)的
页: [1] 2
查看完整版本: 【民科】使用44k采样必然得到全损音质