This article explores the implementation of gradient descent algorithms for minimizing global loss functions in neural networks, particularly in problems governed by Rankine-Hugoniot conditions. While gradient descent reliably converges, scalability issues arise when handling large domains with many coupled networks. To address this, a domain decomposition method (DDM) is introduced, enabling parallel optimization of local loss functions. The result is faster convergence, improved scalability, and a more efficient framework for training complex AI models.This article explores the implementation of gradient descent algorithms for minimizing global loss functions in neural networks, particularly in problems governed by Rankine-Hugoniot conditions. While gradient descent reliably converges, scalability issues arise when handling large domains with many coupled networks. To address this, a domain decomposition method (DDM) is introduced, enabling parallel optimization of local loss functions. The result is faster convergence, improved scalability, and a more efficient framework for training complex AI models.

Why Gradient Descent Converges (and Sometimes Doesn’t) in Neural Networks

2025/09/19 18:38

Abstract and 1. Introduction

1.1. Introductory remarks

1.2. Basics of neural networks

1.3. About the entropy of direct PINN methods

1.4. Organization of the paper

  1. Non-diffusive neural network solver for one dimensional scalar HCLs

    2.1. One shock wave

    2.2. Arbitrary number of shock waves

    2.3. Shock wave generation

    2.4. Shock wave interaction

    2.5. Non-diffusive neural network solver for one dimensional systems of CLs

    2.6. Efficient initial wave decomposition

  2. Gradient descent algorithm and efficient implementation

    3.1. Classical gradient descent algorithm for HCLs

    3.2. Gradient descent and domain decomposition methods

  3. Numerics

    4.1. Practical implementations

    4.2. Basic tests and convergence for 1 and 2 shock wave problems

    4.3. Shock wave generation

    4.4. Shock-Shock interaction

    4.5. Entropy solution

    4.6. Domain decomposition

    4.7. Nonlinear systems

  4. Conclusion and References

3. Gradient descent algorithm and efficient implementation

In this section we discuss the implementation of gradient descent algorithms for solving the minimization problems (11), (20) and (35). We note that these problems involve a global loss functional measuring the residue of HCL in the whole domain, as well Rankine-Hugoniot conditions, which results in training of a number of neural networks. In all the tests we have done, the gradient descent method converges and provides accurate results. We note also, that in problems with a large number of DLs, the global loss functional couples a large number of networks and the gradient descent algorithm may converge slowly. For these problems we present a domain decomposition method (DDM).

3.1. Classical gradient descent algorithm for HCLs

All the problems (11), (20) and (35) being similar, we will demonstrate in details the algorithm for the problem (20). We assume that the solution is initially constituted by i) D ∈ {1, 2, . . . , } entropic shock waves emanating from x1, . . . , xD, ii) an arbitrary number of rarefaction waves, and that iii) there is no shock generation for t ∈ [0, T].

\

\

3.2. Gradient descent and domain decomposition methods

Rather than minimizing the global loss function (21) (or (12), (36)), we here propose to decouple the optimization of the neural networks, and make it scalable. The approach is closely connected to domain decomposition methods (DDMs) Schwarz Waveform Relaxation (SWR) methods [21, 22, 23]. The resulting algorithm allows for embarrassingly parallel computation of minimization of local loss functions.

\ \

\ \ \

\ \ \

\ \ In conclusion, the DDM becomes relevant thanks to its scalability and for kDDMkLocal < kGlobal, which is expected for D large.

\

:::info Authors:

(1) Emmanuel LORIN, School of Mathematics and Statistics, Carleton University, Ottawa, Canada, K1S 5B6 and Centre de Recherches Mathematiques, Universit´e de Montr´eal, Montreal, Canada, H3T 1J4 (elorin@math.carleton.ca);

(2) Arian NOVRUZI, a Corresponding Author from Department of Mathematics and Statistics, University of Ottawa, Ottawa, ON K1N 6N5, Canada (novruzi@uottawa.ca).

:::


:::info This paper is available on arxiv under CC by 4.0 Deed (Attribution 4.0 International) license.

:::

\

Disclaimer: The articles reposted on this site are sourced from public platforms and are provided for informational purposes only. They do not necessarily reflect the views of MEXC. All rights remain with the original authors. If you believe any content infringes on third-party rights, please contact service@support.mexc.com for removal. MEXC makes no guarantees regarding the accuracy, completeness, or timeliness of the content and is not responsible for any actions taken based on the information provided. The content does not constitute financial, legal, or other professional advice, nor should it be considered a recommendation or endorsement by MEXC.
Share Insights

You May Also Like

Let insiders trade – Blockworks

Let insiders trade – Blockworks

The post Let insiders trade – Blockworks appeared on BitcoinEthereumNews.com. This is a segment from The Breakdown newsletter. To read more editions, subscribe ​​“The most valuable commodity I know of is information.” — Gordon Gekko, Wall Street Ten months ago, FBI agents raided Shayne Coplan’s Manhattan apartment, ostensibly in search of evidence that the prediction market he founded, Polymarket, had illegally allowed US residents to place bets on the US election. Two weeks ago, the CFTC gave Polymarket the green light to allow those very same US residents to place bets on whatever they like. This is quite the turn of events — and it’s not just about elections or politics. With its US government seal of approval in hand, Polymarket is reportedly raising capital at a valuation of $9 billion — a reflection of the growing belief that prediction markets will be used for much more than betting on elections once every four years. Instead, proponents say prediction markets can provide a real service to the world by providing it with better information about nearly everything. I think they might, too — but only if insiders are free to participate. Yesterday, for example, Polymarket announced new betting markets on company earnings reports, with a promise that it would improve the information that investors have to work with.  Instead of waiting three months to find out how a company is faring, investors could simply watch the odds on Polymarket.  If the probability of an earnings beat is rising, for example, investors would know at a glance that things are going well. But that will only happen if enough of the people betting actually know how things are going. Relying on the wisdom of crowds to magically discern how a business is doing won’t add much incremental knowledge to the world; everyone’s guesses are unlikely to average out to the truth. If…
Share
BitcoinEthereumNews2025/09/18 05:16
Share
Grayscale GDLC kan multi-crypto ETF worden

Grayscale GDLC kan multi-crypto ETF worden

Connect met Like-minded Crypto Enthusiasts! Connect op Discord! Check onze Discord   De Amerikaanse Securities and Exchange Commission heeft groen licht gegeven voor de omzetting van het Grayscale Digital Large Cap Fund naar een exchange traded product op NYSE Arca. Daarmee wordt voor het eerst in de Verenigde Staten een multi crypto product officieel toegelaten tot een gereguleerde beurs. Deze beslissing is een nieuwe fase in de adoptie van crypto door de financiële sector. Van OTC naar gereguleerd beursproduct Tot nu toe werd de GDLC verhandeld als een OTC fonds wat vaak samen ging met beperkte toegang en structurele prijsafwijkingen van de onderliggende waarde. Met de conversie naar een ETP verdwijnt dit nadeel. Beleggers krijgen de mogelijkheid om intraday exposure te verkrijgen tot meerdere cryptocurrencies tegelijk. Volgens de laatste cijfers beheert het fonds meer dan $915 miljoen aan activa. Het product wordt opgebouwd uit vijf grote namen: Bitcoin, Ethereum, XRP, Solana en Cardano. Deze samenstelling zorgt voor een bredere spreiding van risico’s. Verspreiden binnen een product Het belangrijkste voordeel van een multi crypto ETF is de mogelijkheid tot directe diversificatie. Waar beleggers bij een Bitcoin ETF enkel afhankelijk zijn van de prijs van BTC, biedt GDLC in een product toegang tot meerdere top altcoins. Daarmee ontstaat een beter evenwicht tussen rendement en risico, vooral voor institutionele beleggers die op zoek zijn naar een gereguleerde manier om hun allocatie te verbreden. SEC zet stap richting duidelijker regelgeving De goedkeuring van de GDLC past binnen de nieuwe generic listing standards van de SEC. Deze standaarden zijn bedoeld om de beoordeling van crypto ETF’s te versnellen en voorspelbaarder te maken. In plaats van elk afzonderlijk dossier langdurig te analyseren, kunnen producten die aan basiscriteria voldoen sneller op de markt komen. Voor de sector is dit een signaal dat de toezichthouder zich beweegt van een handhavings gerichte aanpak naar een meer gestructureerd regelgevende aanpak. Institutionele partijen die eerder huiverig waren, zien hiermee de drempel verlaagd om toe te treden. Grayscale Digital Large Cap Fund $GDLC was just approved for trading along with the Generic Listing Standards. The Grayscale team is working expeditiously to bring the *FIRST* multi #crypto asset ETP to market with Bitcoin, Ethereum, XRP, Solana, and Cardano#BTC #ETH $XRP $SOL… — Peter Mintzberg (@PeterMintzberg) September 17, 2025 Impact op markt en instroom De timing van deze beslissing is verrassend. Bitcoin ETF’s hadden recent nog dagelijkse instromen van gemiddeld $290 miljoen, terwijl Ethereum producten juist uitstromen zagen. Een multi crypto product aantrekkelijk worden als alternatief dat beide assets en belangrijke altcoins combineert. Analisten wijzen erop dat als GDLC slechts vijf procent van de huidige instromen naar Bitcoin-ETF’s weet aan te trekken, dit al kan neerkomen op zo’n $15 miljoen per dag. Nieuwe routes voor institutionele allocatie Voor institutionele beleggers die diversificatie zoeken binnen de crypto markt zonder afhankelijk te zijn van ongecontroleerde exchanges, opent GDLC een gereguleerde en transparante route. Met een aankoop krijgen zij toegang tot meerdere leidende blockchains, waarbij de custody en naleving van regelgeving gewaarborgd zijn. De komst van dit product kan bovendien een domino effect veroorzaken. Er liggen momenteel nog tientallen aanvragen voor crypto ETF’s bij de SEC, variërend van stablecoin exposure tot altcoins als Avalanche en Litecoin. Best wallet - betrouwbare en anonieme wallet Best wallet - betrouwbare en anonieme wallet Meer dan 60 chains beschikbaar voor alle crypto Vroege toegang tot nieuwe projecten Hoge staking belongingen Lage transactiekosten Best wallet review Koop nu via Best Wallet Let op: cryptocurrency is een zeer volatiele en ongereguleerde investering. Doe je eigen onderzoek. Het bericht Grayscale GDLC kan multi-crypto ETF worden is geschreven door Timo Bruinsel en verscheen als eerst op Bitcoinmagazine.nl.
Share
Coinstats2025/09/20 02:31
Share