User Tools

Site Tools


ro:course:math:recap:integral-calculus

Calcul Integral

Derivarea reprezintă doar jumătate din conținutul unei educații tradiționale de calcul. Celălalt pilon, integrarea, începe părând o întrebare destul de disjunctă: „Care este aria de sub această curbă?” Deși aparent nelegată, integrarea este strâns împletită cu derivarea prin ceea ce este cunoscut sub numele de teorema fundamentală a calculului integral.

La nivelul învățării automate discutat în această carte, nu vom avea nevoie de o înțelegere profundă a integrării. Cu toate acestea, vom oferi o scurtă introducere pentru a pune bazele oricăror aplicații ulterioare pe care le vom întâlni mai târziu.

Interpretare Geometrică

Să presupunem că avem o funcție $f(x)$. Pentru simplitate, să presupunem că $f(x)$ este non-negativă (nu ia niciodată o valoare mai mică decât zero). Ceea ce vrem să încercăm și să înțelegem este: care este aria conținută între $f(x)$ și axa $x$?

#@tab pytorch
%matplotlib inline
from d2l import torch as d2l
from IPython import display
from mpl_toolkits import mplot3d
import torch
 
x = torch.arange(-2, 2, 0.01)
f = torch.exp(-x**2)
 
d2l.set_figsize()
d2l.plt.plot(x, f, color='black')
d2l.plt.fill_between(x.tolist(), f.tolist())
d2l.plt.show()

În majoritatea cazurilor, această arie va fi infinită sau nedefinită (luați în considerare aria de sub $f(x) = x^{2}$), așa că oamenii vor vorbi adesea despre aria dintre o pereche de capete, să zicem $a$ și $b$.

#@tab pytorch
x = torch.arange(-2, 2, 0.01)
f = torch.exp(-x**2)
 
d2l.set_figsize()
d2l.plt.plot(x, f, color='black')
d2l.plt.fill_between(x.tolist()[50:250], f.tolist()[50:250])
d2l.plt.show()

Vom nota această arie prin simbolul integral de mai jos:

$$ \textrm{Arie}(\mathcal{A}) = \int_a^b f(x) \;dx. $$

Variabila internă este o variabilă, la fel ca indicele unei sume într-o $\sum$, și deci aceasta poate fi scrisă echivalent cu orice valoare internă ne place:

$$ \int_a^b f(x) \;dx = \int_a^b f(z) \;dz. $$

Există un mod tradițional de a încerca și de a înțelege cum am putea încerca să aproximăm astfel de integrale: ne putem imagina luând regiunea dintre $a$ și $b$ și tăind-o în $N$ felii verticale. Dacă $N$ este mare, putem aproxima aria fiecărei felii printr-un dreptunghi, și apoi să adunăm ariile pentru a obține aria totală de sub curbă. Să aruncăm o privire la un exemplu făcând acest lucru în cod. Vom vedea cum să obținem valoarea adevărată într-o secțiune ulterioară.

#@tab pytorch
epsilon = 0.05
a = 0
b = 2
 
x = torch.arange(a, b, epsilon)
f = x / (1 + x**2)
 
approx = torch.sum(epsilon*f)
true = torch.log(torch.tensor([5.])) / 2
 
d2l.set_figsize()
d2l.plt.bar(x, f, width=epsilon, align='edge')
d2l.plt.plot(x, f, color='black')
d2l.plt.ylim([0, 1])
d2l.plt.show()
 
f'aproximare: {approx}, adevăr: {true}'

Problema este că, deși se poate face numeric, putem face această abordare analitic doar pentru cele mai simple funcții precum

$$ \int_a^b x \;dx. $$

Orice funcție ceva mai complexă, precum exemplul nostru din codul de mai sus

$$ \int_a^b \frac{x}{1+x^{2}} \;dx. $$

este dincolo de ceea ce putem rezolva cu o metodă atât de directă.

Vom adopta în schimb o abordare diferită. Vom lucra intuitiv cu noțiunea de arie și vom învăța principalul instrument computațional folosit pentru a găsi integrale: teorema fundamentală a calculului integral. Aceasta va fi baza studiului nostru despre integrare.

Teorema Fundamentală a Calculului Integral

Pentru a ne scufunda mai adânc în teoria integrării, să introducem o funcție

$$ F(x) = \int_0^x f(y) dy. $$

Această funcție măsoară aria dintre $0$ și $x$ în funcție de cum schimbăm $x$. Observați că aceasta este tot ce avem nevoie, deoarece

$$ \int_a^b f(x) \;dx = F(b) - F(a). $$

Aceasta este o codificare matematică a faptului că putem măsura aria până la punctul final îndepărtat și apoi scădem aria până la punctul final apropiat, așa cum este indicat în .

Vizualizând de ce putem reduce problema calculării ariei de sub o curbă între două puncte la calcularea ariei la stânga unui punct.

Astfel, putem afla care este integrala pe orice interval aflând ce este $F(x)$.

Pentru a face acest lucru, să luăm în considerare un experiment. Așa cum facem adesea în calcul, să ne imaginăm ce se întâmplă când schimbăm valoarea cu o cantitate mică. Din comentariul de mai sus, știm că

$$ F(x+\epsilon) - F(x) = \int_x^{x+\epsilon} f(y) \; dy. $$

Aceasta ne spune că funcția se schimbă cu aria de sub o felie mică a unei funcții.

Acesta este punctul în care facem o aproximare. Dacă ne uităm la o felie mică de arie ca aceasta, arată ca și cum această arie este apropiată de aria dreptunghiulară cu înălțimea valorii lui $f(x)$ și lățimea bazei $\epsilon$. Într-adevăr, se poate arăta că pe măsură ce $\epsilon \rightarrow 0$ această aproximare devine din ce în ce mai bună. Astfel putem concluziona:

$$ F(x+\epsilon) - F(x) \approx \epsilon f(x). $$

Cu toate acestea, putem observa acum: acesta este exact modelul pe care îl așteptăm dacă am calcula derivata lui $F$! Astfel vedem următorul fapt destul de surprinzător:

$$ \frac{dF}{dx}(x) = f(x). $$

Aceasta este teorema fundamentală a calculului integral. O putem scrie în formă extinsă ca $$\frac{d}{dx}\int_0^x f(y) \; dy = f(x).$$

Aceasta ia conceptul de a găsi arii (a priori destul de greu), și îl reduce la o afirmație despre derivate (ceva mult mai complet înțeles). Un ultim comentariu pe care trebuie să-l facem este că acest lucru nu ne spune exact ce este $F(x)$. Într-adevăr $F(x) + C$ pentru orice $C$ are aceeași derivată. Acesta este un fapt de viață în teoria integrării. Din fericire, observați că atunci când lucrați cu integrale definite, constantele dispar, și astfel sunt irelevante pentru rezultat.

$$ \int_a^b f(x) \; dx = (F(b) + C) - (F(a) + C) = F(b) - F(a). $$

Acest lucru poate părea un nonsens abstract, dar să luăm un moment pentru a aprecia că ne-a oferit o perspectivă complet nouă asupra calculării integralelor. Scopul nostru nu mai este să facem un fel de proces de tăiere-și-însumare pentru a încerca să recuperăm aria, ci trebuie doar să găsim o funcție a cărei derivată este funcția pe care o avem! Acest lucru este incredibil, deoarece acum putem lista multe integrale destul de dificile doar inversând tabelul din . De exemplu, știm că derivata lui $x^{n}$ este $nx^{n-1}$. Astfel, putem spune folosind teorema fundamentală :eqref:eq_ftc

$$ \int_0^{x} ny^{n-1} \; dy = x^n - 0^n = x^n. $$

Similar, știm că derivata lui $e^{x}$ este ea însăși, deci asta înseamnă

$$ \int_0^{x} e^{x} \; dx = e^{x} - e^{0} = e^x - 1. $$

În acest fel, putem dezvolta întreaga teorie a integrării valorificând liber ideile din calculul diferențial. Fiecare regulă de integrare derivă din acest singur fapt.

Schimbarea Variabilelor

La fel ca în cazul diferențierii, există o serie de reguli care fac calculul integralelor mai abordabil. De fapt, fiecare regulă a calculului diferențial (cum ar fi regula produsului, regula sumei și regula lanțului) are o regulă corespunzătoare pentru calculul integral (integrarea prin părți, liniaritatea integrării și, respectiv, formula de schimbare a variabilelor). În această secțiune, ne vom scufunda în ceea ce este probabil cea mai importantă din listă: formula de schimbare a variabilelor.

Mai întâi, să presupunem că avem o funcție care este ea însăși o integrală:

$$ F(x) = \int_0^x f(y) \; dy. $$

Să presupunem că vrem să știm cum arată această funcție când o compunem cu alta pentru a obține $F(u(x))$. Prin regula lanțului, știm

$$ \frac{d}{dx}F(u(x)) = \frac{dF}{du}(u(x))\cdot \frac{du}{dx}. $$

Putem transforma asta într-o afirmație despre integrare folosind teorema fundamentală :eqref:eq_ftc ca mai sus. Aceasta dă

$$ F(u(x)) - F(u(0)) = \int_0^x \frac{dF}{du}(u(y))\cdot \frac{du}{dy} \;dy. $$

Reamintindu-ne că $F$ este ea însăși o integrală, rezultă că partea stângă poate fi rescrisă ca fiind

$$ \int_{u(0)}^{u(x)} f(y) \; dy = \int_0^x \frac{dF}{du}(u(y))\cdot \frac{du}{dy} \;dy. $$

Similar, reamintindu-ne că $F$ este o integrală ne permite să recunoaștem că $\frac{dF}{dx} = f$ folosind teorema fundamentală :eqref:eq_ftc, și astfel putem concluziona

$$\int_{u(0)}^{u(x)} f(y) \; dy = \int_0^x f(u(y))\cdot \frac{du}{dy} \;dy.$$

Aceasta este formula schimbării de variabilă.

Pentru o derivare mai intuitivă, luați în considerare ce se întâmplă atunci când luăm o integrală a lui $f(u(x))$ între $x$ și $x+\epsilon$. Pentru un $\epsilon$ mic, această integrală este aproximativ $\epsilon f(u(x))$, aria dreptunghiului asociat. Acum, să comparăm aceasta cu integrala lui $f(y)$ de la $u(x)$ la $u(x+\epsilon)$. Știm că $u(x+\epsilon) \approx u(x) + \epsilon \frac{du}{dx}(x)$, deci aria acestui dreptunghi este aproximativ $\epsilon \frac{du}{dx}(x)f(u(x))$. Astfel, pentru a face ca ria acestor două dreptunghiuri să fie de acord, trebuie să înmulțim primul cu $\frac{du}{dx}(x)$ așa cum este ilustrat în .

Vizualizând transformarea unui singur dreptunghi subțire sub schimbarea variabilelor.

Aceasta ne spune că

$$ \int_x^{x+\epsilon} f(u(y))\frac{du}{dy}(y)\;dy = \int_{u(x)}^{u(x+\epsilon)} f(y) \; dy. $$

Aceasta este formula de schimbare a variabilelor exprimată pentru un singur dreptunghi mic.

Dacă $u(x)$ și $f(x)$ sunt alese corespunzător, acest lucru poate permite calcularea unor integrale incredibil de complexe. De exemplu, dacă am alege chiar $f(y) = 1$ și $u(x) = e^{-x^{2}}$ (ceea ce înseamnă $\frac{du}{dx}(x) = -2xe^{-x^{2}}$), acest lucru poate arăta de exemplu că

$$ e^{-1} - 1 = \int_{e^{-0}}^{e^{-1}} 1 \; dy = -2\int_0^{1} ye^{-y^2}\;dy, $$

și astfel rearanjând că

$$ \int_0^{1} ye^{-y^2}\; dy = \frac{1-e^{-1}}{2}. $$

Un Comentariu despre Convențiile de Semn

Cititorii cu ochi ageri vor observa ceva ciudat despre calculele de mai sus. Anume, calcule precum

$$ \int_{e^{-0}}^{e^{-1}} 1 \; dy = e^{-1} -1 < 0, $$

pot produce numere negative. Când ne gândim la arii, poate fi ciudat să vedem o valoare negativă, și deci merită să săpăm în ceea ce este convenția.

Matematicienii iau noțiunea de arii cu semn. Aceasta se manifestă în două moduri. Mai întâi, dacă considerăm o funcție $f(x)$ care este uneori mai mică decât zero, atunci aria va fi de asemenea negativă. Deci de exemplu

$$ \int_0^{1} (-1)\;dx = -1. $$

Similar, integralele care progresează de la dreapta la stânga, mai degrabă decât de la stânga la dreapta sunt luate de asemenea ca arii negative

$$ \int_0^{-1} 1\; dx = -1. $$

Aria standard (de la stânga la dreapta a unei funcții pozitive) este întotdeauna pozitivă. Orice obținut prin răsturnarea ei (să zicem răsturnarea peste axa $x$ pentru a obține integrala unui număr negativ, sau răsturnarea peste axa $y$ pentru a obține o integrală în ordinea greșită) va produce o arie negativă. Și într-adevăr, răsturnarea de două ori va da o pereche de semne negative care se anulează pentru a avea arie pozitivă

$$ \int_0^{-1} (-1)\;dx = 1. $$

Dacă această discuție sună familiar, așa este! În am discutat cum determinantul a reprezentat aria cu semn în mare parte în același mod.

Integrale Multiple

În unele cazuri, vom avea nevoie să lucrăm în dimensiuni superioare. De exemplu, presupuneți că avem o funcție de două variabile, ca $f(x, y)$ și vrem să știm volumul de sub $f$ când $x$ variază peste $[a, b]$ și $y$ variază peste $[c, d]$.

#@tab pytorch
# Construct grid and compute function
x, y = torch.meshgrid(torch.linspace(-2, 2, 101), torch.linspace(-2, 2, 101))
z = torch.exp(- x**2 - y**2)
 
# Plot function
ax = d2l.plt.figure().add_subplot(111, projection='3d')
ax.plot_wireframe(x, y, z)
d2l.plt.xlabel('x')
d2l.plt.ylabel('y')
d2l.plt.xticks([-2, -1, 0, 1, 2])
d2l.plt.yticks([-2, -1, 0, 1, 2])
d2l.set_figsize()
ax.set_xlim(-2, 2)
ax.set_ylim(-2, 2)
ax.set_zlim(0, 1)
ax.dist = 12

Scriem aceasta ca

$$ \int_{[a, b]\times[c, d]} f(x, y)\;dx\;dy. $$

Să presupunem că dorim să calculăm această integrală. Afirmația mea este că putem face acest lucru calculând iterativ mai întâi integrala în $x$ și apoi mutându-ne la integrala în $y$, adică

$$ \int_{[a, b]\times[c, d]} f(x, y)\;dx\;dy = \int_c^{d} \left(\int_a^{b} f(x, y) \;dx\right) \; dy. $$

Să vedem de ce este așa.

Luați în considerare figura de mai sus unde am împărțit funcția în pătrate $\epsilon \times \epsilon$ pe care le vom indexa cu coordonate întregi $i, j$. În acest caz, integrala noastră este aproximativ

$$ \sum_{i, j} \epsilon^{2} f(\epsilon i, \epsilon j). $$

Odată ce discretizăm problema, putem aduna valorile pe aceste pătrate în orice ordine ne place, și să nu ne îngrijorăm despre schimbarea valorilor. Acest lucru este ilustrat în . În particular, putem spune că

$$ \sum _ {j} \epsilon \left(\sum_{i} \epsilon f(\epsilon i, \epsilon j)\right). $$

Ilustrând cum să descompunem o sumă peste multe pătrate ca o sumă peste mai întâi coloane (1), apoi adunând sumele coloanelor împreună (2).

Suma din interior este exact discretizarea integralei

$$ G(\epsilon j) = \int _a^{b} f(x, \epsilon j) \; dx. $$

În cele din urmă, observați că dacă combinăm aceste două expresii obținem

$$ \sum _ {j} \epsilon G(\epsilon j) \approx \int _ {c}^{d} G(y) \; dy = \int _ {[a, b]\times[c, d]} f(x, y)\;dx\;dy. $$

Astfel punând totul împreună, avem că

$$ \int _ {[a, b]\times[c, d]} f(x, y)\;dx\;dy = \int _ c^{d} \left(\int _ a^{b} f(x, y) \;dx\right) \; dy. $$

Observați că, odată discretizat, tot ce am făcut a fost să rearanjăm ordinea în care am adunat o listă de numere. Acest lucru poate face să pară că nu este nimic, totuși acest rezultat (numit Teorema lui Fubini) nu este întotdeauna adevărat! Pentru tipul de matematică întâlnit când facem învățare automată (funcții continue), nu există nicio îngrijorare, totuși este posibil să creăm exemple unde eșuează (de exemplu funcția $f(x, y) = xy(x^2-y^2)/(x^2+y^2)^3$ peste dreptunghiul $[0,2]\times[0,1]$).

Rețineți că alegerea de a face integrala în $x$ mai întâi, și apoi integrala în $y$ a fost arbitrară. Am fi putut la fel de bine alege să facem $y$ mai întâi și apoi $x$ pentru a vedea

$$ \int _ {[a, b]\times[c, d]} f(x, y)\;dx\;dy = \int _ a^{b} \left(\int _ c^{d} f(x, y) \;dy\right) \; dx. $$

De multe ori, vom condensa la notația vectorială, și vom spune că pentru $U = [a, b]\times [c, d]$ aceasta este

$$ \int _ U f(\mathbf{x})\;d\mathbf{x}. $$

Schimbarea Variabilelor în Integrale Multiple

Ca și cu variabilele singulare în :eqref:eq_change_var, abilitatea de a schimba variabile în interiorul unei integrale de dimensiune superioară este un instrument cheie. Să rezumăm rezultatul fără derivare.

Avem nevoie de o funcție care re-parametrizează domeniul nostru de integrare. Putem lua aceasta să fie $\phi : \mathbb{R}^n \rightarrow \mathbb{R}^n$, adică orice funcție care ia $n$ variabile reale și returnează alte $n$. Pentru a păstra expresiile curate, vom asuma că $\phi$ este injectivă ceea ce înseamnă că nu se pliază niciodată peste ea însăși ($\phi(\mathbf{x}) = \phi(\mathbf{y}) \implies \mathbf{x} = \mathbf{y}$).

În acest caz, putem spune că

$$ \int _ {\phi(U)} f(\mathbf{x})\;d\mathbf{x} = \int _ {U} f(\phi(\mathbf{x})) \left|\det(D\phi(\mathbf{x}))\right|\;d\mathbf{x}. $$

unde $D\phi$ este Jacobianul lui $\phi$, care este matricea derivatelor parțiale ale lui $\boldsymbol{\phi} = (\phi_1(x_1, \ldots, x_n), \ldots, \phi_n(x_1, \ldots, x_n))$,

$$ D\boldsymbol{\phi} = \begin{bmatrix} \frac{\partial \phi _ 1}{\partial x _ 1} & \cdots & \frac{\partial \phi _ 1}{\partial x _ n} \\ \vdots & \ddots & \vdots \\ \frac{\partial \phi _ n}{\partial x _ 1} & \cdots & \frac{\partial \phi _ n}{\partial x _ n} \end{bmatrix}. $$

Privind îndeaproape, vedem că aceasta este similară cu regula lanțului pentru o singură variabilă :eqref:eq_change_var, cu excepția faptului că am înlocuit termenul $\frac{du}{dx}(x)$ cu $\left|\det(D\phi(\mathbf{x}))\right|$. Să vedem cum putem interpreta acest termen. Reamintiți-vă că termenul $\frac{du}{dx}(x)$ a existat pentru a spune cât de mult ne-am întins axa $x$ aplicând $u$. Același proces în dimensiuni superioare este de a determina cât de mult întindem aria (sau volumul, sau hiper-volumul) unui mic pătrat (sau mic hiper-cub) aplicând $\boldsymbol{\phi}$. Dacă $\boldsymbol{\phi}$ a fost înmulțirea cu o matrice, atunci știm cum determinantul dă deja răspunsul.

Cu puțină muncă, se poate arăta că Jacobianul oferă cea mai bună aproximare a unei funcții multivariabile $\boldsymbol{\phi}$ la un punct printr-o matrice în același mod în care am putea aproxima prin linii sau plane cu derivate și gradienți. Astfel determinantul Jacobianului oglindește exact factorul de scalare pe care l-am identificat într-o dimensiune.

Este nevoie de ceva muncă pentru a completa detaliile la acest lucru, așa că nu vă faceți griji dacă nu sunt clare acum. Să vedem cel puțin un exemplu de care ne vom folosi mai târziu. Considerați integrala

$$ \int _ {-\infty}^{\infty} \int _ {-\infty}^{\infty} e^{-x^{2}-y^{2}} \;dx\;dy. $$

Jucându-ne cu această integrală direct nu ne va duce nicăieri, dar dacă schimbăm variabilele, putem face progrese semnificative. Dacă lăsăm $\boldsymbol{\phi}(r, \theta) = (r \cos(\theta), r\sin(\theta))$ (ceea ce înseamnă că $x = r \cos(\theta)$, $y = r \sin(\theta)$), atunci putem aplica formula de schimbare a variabilei pentru a vedea că acesta este același lucru cu

$$ \int _ 0^\infty \int_0 ^ {2\pi} e^{-r^{2}} \left|\det(D\mathbf{\phi}(\mathbf{x}))\right|\;d\theta\;dr, $$

unde

$$ \left|\det(D\mathbf{\phi}(\mathbf{x}))\right| = \left|\det\begin{bmatrix} \cos(\theta) & -r\sin(\theta) \\ \sin(\theta) & r\cos(\theta) \end{bmatrix}\right| = r(\cos^{2}(\theta) + \sin^{2}(\theta)) = r. $$

Astfel, integrala este

$$ \int _ 0^\infty \int _ 0 ^ {2\pi} re^{-r^{2}} \;d\theta\;dr = 2\pi\int _ 0^\infty re^{-r^{2}} \;dr = \pi, $$

unde egalitatea finală urmează prin același calcul pe care l-am folosit în secțiunea .

Vom întâlni această integrală din nou când studiem variabile aleatoare continue în .

Rezumat

  • Teoria integrării ne permite să răspundem la întrebări despre arii sau volume.
  • Teorema fundamentală a calculului integral ne permite să valorificăm cunoștințele despre derivate pentru a calcula arii prin observația că derivata ariei până la un punct este dată de valoarea funcției integrate.
  • Integralele în dimensiuni superioare pot fi calculate iterând integrale de variabilă singulară.

Exerciții

  1. Cât este $\int_1^2 \frac{1}{x} \;dx$?
  2. Folosiți formula de schimbare a variabilelor pentru a integra $\int_0^{\sqrt{\pi}}x\sin(x^2)\;dx$.
  3. Cât este $\int_{[0,1]^2} xy \;dx\;dy$?
  4. Folosiți formula de schimbare a variabilelor pentru a calcula $\int_0^2\int_0^1xy(x^2-y^2)/(x^2+y^2)^3\;dy\;dx$ și $\int_0^1\int_0^2f(x, y) = xy(x^2-y^2)/(x^2+y^2)^3\;dx\;dy$ pentru a vedea că sunt diferite.

Discuții

ro/course/math/recap/integral-calculus.txt · Last modified: by 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki