- Μηνύματα
- 19.571
- Reaction score
- 23.655
Ναι σε γενικό πλαίσο σωστά. Με μεγαλύτερη ταχύτητα αυξάνεται μόνο η αποδοτικότητα αλλά και μόνο έμμεσα οι αλγόριθμοι καθώς με μεγαλύτερες ταχύτητες (ανάλογα και το είδος του αλγοριθμου , δεν την έχουν όλοι "ανάγκη¨την ταχύτητα αυτή ώστε να ανεβάσουν αποδοτικότητα εξαρτάται απο το Ο κλπ) έχεις την ευκαιρία να σχεδιάσεις καλύτερο αλγόριθμο που θα λύνει προβλήματα που πριν δεν εμπεριέχονταν ως inputs (πλήθος και είδος).Δεν μπορω να καταλαβω πως τοσο ευκολα παιρνετε πραγματα ως δεδομενα ...Το ποσο αυξανεται η υπολογιστικη ικανοτητα δεν σημαινει οτι υπαρχει και η τελεια μεθοδος επεξεργασιας . Απλα θα φερει αποτελεσμα πιο γρηγορα οχι απαραιτητα πιο σωστα .
Συμφωνω οτι θα φτασουμε εκει αλλα οχι ακομα
σε εναν υπολογιστη εχεις 5 διαφορετικα player το καθε ενα απο αυτα παιζει διαφορετικα λογο του διαφορετικου αλγορυθμου επξεργασιας που εχει . Η ικανοτητα του υπαολογιστη σε μνημες και υπολογιστικη ικανοτητα στις μερες μας ειναι τοση πολυ που δεν παιζει απολυτως κανενα ρολο .
18 μηες μετα οταν διπλασιαστει δεν θα αλλαξει τιποτα
Θα αλλαξει οταν βελτιωθει ο αλγορυθμος που δουλευει το player
Στο audio χρησιμοποιούνται πολλών ειδών (κυρίως στην παραγωγη με τα DAW) κα΄ποιοι απο αυτούς μπορεί να ευνοήσουν κάποια θέματα αποδοσης κάποιοι όχι. Οι περισσότεροι ηχητικά κρισιμοι αλγοριθμοί στο audio είναι πολυωνυμικοί νομίζω οπότε όχι τόσο πολύ. ¨Εχει βέβαια κάθε είδους γραμμικούς , λογαριθμικούς ;κλπ ;; Εξάλλου το όριο της ταχύτητας με τα τρανζίστορ και πόσα χωράνε σε ένα τσίπ ήδη έχει κορυφωθεί , ο Moore's Law πλέον δεν προκειται να αποφέρει βελτιώσεις όπως νομίζουν όλοι ακόμη και στην πρόγνωση καιρού, ή στην βιομηχανία πετρελαίου ή στο χρηματιστήριο ή στο δίπλωμα προτείνης που είχε και έναν σημαντικό ρόλο η ταχύτητα .... στο audio τώρα θα προκύψει βελτίωση ; Ήδη οι ταχύτητες υπερκαλύπτονται απο ενα Mac λαπτοπ.
Ο @steadyshot ισως θα μπορούσε να βοηθησει και να αποκωδικοποίησει για εμας την σχεση αυτή σε αλγόριθμους που χρησιμοποιουνται στο audio (κυρίως στην παραγωγή της μουσικής και όχι τόσο στην αναπαραγωγή είναι ζήτημα άξιο εξέτασης). εδω τα ειδη που χρησιμοποιουνται :
- Sample-rate processing
- Linear interpolation, cubic interpolation, windowed sinc (bandlimited) interpolation for resampling and sample-rate conversion.
- Polyphase filters for efficient high-quality conversion.
- Fixed/streaming block processing
- Overlap-add / Overlap-save for convolution and FFT-based processing.
- Double-buffering and lock-free ring buffers for real-time audio I/O.
- Window functions
- Hann, Hamming, Blackman, Kaiser for spectral analysis and overlap-add.
- FIR filters
- Windowed FIR design (Parks–McClellan for optimal equiripple designs).
- Linear-phase designs used when phase preservation is required.
- IIR filters
- Biquads (2nd-order sections) implemented in cascade for EQs, shelving, and shelving filters.
- Filter design methods: bilinear transform, matched z-transform, Butterworth/Chebyshev/elliptic prototypes.
- Nonlinear processing
- Soft clipping, waveshaping, tanh approximation, diode/asymmetric models for distortion/saturation.
- ARC (autoregressive models) and memoryless vs. memory nonlinear filters.
- Fast Fourier Transform (FFT)
- STFT (Short-Time Fourier Transform) for spectral analysis, spectral effects, phase vocoder.
- Overlap-add for inverse transforms.
- Spectral processing
- Phase vocoder for time-stretching and pitch-shifting (Griffin–Lim variants for phase reconstruction).
- Sinusoidal modeling + additive resynthesis for high-quality pitch/time manipulation.
- Spectral smoothing, spectral gating, spectral morphing.
- Convolution
- Time-domain FIR for short IRs; FFT-based partitioned convolution for long impulse responses (uniform and non-uniform partitioning for latency vs. CPU tradeoffs).
- Oscillators
- Bandlimited waveform generation: BLEP/BLIT/anti-aliased wavetable oscillators.
- Wavetable interpolation (linear, cubic, sinc) and table morphing.
- Additive synthesis
- Bank of oscillators/partials with envelopes and phase control.
- Subtractive synthesis
- Oscillators + filter (biquad) + envelopes + LFOs.
- FM / Phase modulation
- Complex operator graphs (DX7-style), algorithms for modulation index control and aliasing reduction.
- Granular synthesis
- Windowed grains, randomization, and stream scheduling for texture/texture morphing.
- Physical modeling
- Digital waveguide, modal synthesis, mass-spring networks, finite-difference schemes for strings, plates, and resonators.
- Pitch detection
- Autocorrelation, YIN, pYIN, cepstrum, harmonic product spectrum for monophonic pitch.
- Multi-pitch estimation: NMF (non-negative matrix factorization), probabilistic models, deep-learning-based multi-pitch.
- Onset detection
- Spectral flux, high-frequency content, complex-domain methods, machine-learning classifiers.
- Tempo and beat tracking
- Tempogram, dynamic programming, Viterbi segmentation, probabilistic models, neural beat trackers.
- Harmonic/percussive separation
- Median filtering in spectrogram domain, RPCA (robust principal component analysis), NMF.
- Time-stretching
- Classic: SOLA / WSOLA, overlap-add variants.
- Phase vocoder with transient preservation (transient detection + hybrid approaches).
- Recent: neural time-domain models (e.g., neural vocoders) — note: up-to-date models available as of May 2024.
- Pitch shifting
- Resampling with time correction (phase vocoder), granular pitch shift, PSOLA, or neural approaches.
- Compressors / Limiters
- Envelope detection (peak vs. RMS, lookahead), sidechain filtering, knee functions, gain-smoothing (attack/release via first-order filters).
- Lookahead via delay lines for brick-wall limiting.
- Expansion and gating
- Threshold, ratio, hysteresis, envelope followers.
- Spatialization and panning
- Equal-power panning laws, vector-base amplitude panning (VBAP), binaural convolution (HRTF), ambisonics (spherical harmonics).
- Reverb
- Algorithmic: Schroeder/comb-pass + allpass networks, diffusion networks.
- Hybrid: early-reflection models + late reverb via dense feedback delay networks.
- Convolution reverb using measured IRs (see partitioned FFT convolution above).
- Source separation
- NMF, sparse coding, and deep-learning models (U-Net, Conv-TasNet, Demucs).
- Denoising and enhancement
- Spectral masking, Wiener filtering, DNN-based denoisers, and end-to-end time-domain networks.
- Style transfer and synthesis
- Generative models: WaveNet derivatives, GANs, diffusion models for audio generation and transformation.
- Auto-tagging, classification, and recommender features
- CNNs, transformer architectures applied to spectrogram inputs.
- Parameter smoothing
- Slew limiters, low-pass filters to avoid zipper noise during automation.
- Preset interpolation
- Crossfading in perceptual parameter spaces, parameter mapping curves (linear, exponential, logarithmic).
- Optimization and tuning
- Gradient-based parameter fitting for modeling tasks; least-squares and iterative methods for filter/EQ matching.
- Real-time constraints
- Avoid dynamic memory allocations and heavy locking in audio thread; use SIMD (SSE/AVX), CPU cache-aware algorithms.
- Fixed-point or double precision where required (double for offline/mastering; single for most real-time).
- Anti-aliasing and numerical stability
- Use oversampling where necessary, stable IIR sectioning, denormal handling.
- Latency vs. quality tradeoffs
- Partitioned convolution, block size selection, lookahead settings, offline vs. real-time algorithm choices.
- Texts: Oppenheim & Schafer (signals), Lyons (understanding digital signal processing), Smith (Music DSP), Zölzer (DAFX).
- Libraries and tools: FFTW/FFTPACK, Eigen, JUCE framework, EigenAudio, kissFFT, SoundTouch, Rubber Band Library, TensorFlow/PyTorch models for ML.
- High-quality reverb: measured IR + partitioned FFT convolution for late reverb + algorithmic early reflections for low memory.
- Low-latency pitch shift: phase vocoder with transient-preserving hybrid or PSOLA for monophonic sources; neural models where latency allowance exists.
- Real-time synth oscillator: BLEP/BLIT with wavetable interpolation and antialiasing; use SIMD for polyphony.
Last edited:
