From 61e7ae16a985e2a0169f3969f5108805f4171c46 Mon Sep 17 00:00:00 2001
From: Tim Moon <tmoon@nvidia.com>
Date: Tue, 2 Dec 2025 20:50:29 -0800
Subject: [PATCH 1/5] Add documentation for operation fuser API

Signed-off-by: Tim Moon <tmoon@nvidia.com>
---
 .gitignore                                    |   1 +
 .../op_fuser/fp8_layernorm_linear.png         | Bin 0 -> 17749 bytes
 docs/examples/op_fuser/layernorm_mlp.png      | Bin 0 -> 28980 bytes
 docs/examples/op_fuser/op_fuser.rst           | 253 ++++++++++++++++++
 .../op_fuser/residual_layernorm_mlp.png       | Bin 0 -> 13795 bytes
 docs/index.rst                                |   1 +
 6 files changed, 255 insertions(+)
 create mode 100644 docs/examples/op_fuser/fp8_layernorm_linear.png
 create mode 100644 docs/examples/op_fuser/layernorm_mlp.png
 create mode 100644 docs/examples/op_fuser/op_fuser.rst
 create mode 100644 docs/examples/op_fuser/residual_layernorm_mlp.png
diff --git a/.gitignore b/.gitignore
index 74acd6ad7f5..04828a77862 100644
--- a/.gitignore
+++ b/.gitignore
@@ -41,3 +41,4 @@ compile_commands.json
 .nfs
 tensor_dumps/
 artifacts/
+.DS_Store
\ No newline at end of file
diff --git a/docs/examples/op_fuser/fp8_layernorm_linear.png b/docs/examples/op_fuser/fp8_layernorm_linear.png
new file mode 100644
index 0000000000000000000000000000000000000000..b5916a615281f02d9eb61182fcac05b5b9acc0dc
GIT binary patch
literal 17749
zcmZ^r1ymhD(x`EF4=w?MyL)hVm*DR1!3hKnuEE{i-Q6L$yKC?_?C$^XzCG_<&ONv3
z>8kFYuIaf`U)2p$kP}CQ!-WF@0YQ|M5K#gF0Zj+q5HMgsO&k`cAn*ZUCL}8a0#Y3f
z|6%|M{7-Bop(G0e;z<Dl;ui!0@&r`*9fE+kFoJ*_>w|!BCxd`s+o!iE@&X5fOf)1-
zWo1FAfiesTBq$mPI8Xuw{y;!+K|ZtrB@ii4y#FmLfqwZ{8(;{b79bG+YNG{we!S3t
z_lL|sKf$v=|E)0#?0;H=re}fwZ}~$5$jfQu#|Nyvgr*Y+2w4Be8#HX;`vp)Ku~5-)
z){vFqHnOv!H!!v{G@*C5vHxfe!t2fr6m3kL4T#-stZkjR-T6rW(SjQ&e^fJ&691!#
zvlSnyhO7dyu$`j`F*`jYJtHYU95FF5ucNUkw~~n1zr=z6_(;v2o$a|97~I_4=-pW8
z?HtV*n7FvO7#Nuun3?H-7IaP?w$29bbhb`p|5WlndPGc|j2tcOoh|Hai9hrj7}~iw
z^O2H%bo9Tke~#1H!t~!g**g7eTEGMuK8`Rj(K9mqzr;-3E&e}ZA4mQv_K$h}vpe1o
zW!#!dCQf$NE+50<XX51jM-Ts3<-f=GPl128SGBcp=4bww$bVJ;x0J@ekN>-y|E&CP
z0eMFY6W~Ptb6o%G<3H>Eqy5M1xD_niO{_IUENo0{oj&Hm!OY0Z@c%sW-;%<1)^?7{
z_69~K{7nB6`H!mqZvBsbH2>WXD<j)~_VXV{{w2xF@UhzevHJfst$)-4w#5&}%kaN;
z$`3avV#NUhA_yWWBBbIDdX@q0uF}6eSbNm|unte+j8dHK*8Js1K=@KcxVsH@+ZQm>
zAK0i2;l%eyIYdhN=;60$Fra8N=rdjnt$!|l<MYwC4x83`O`QK(bNkJk#^q$Xp7J=J
z{vhLJCaP3C7sM~(2ZI7COrmf31v1+a1(Z|}Vi_hzDc4mH;)kCQDsjH4!n|ZK37Cjq
zJZ}BRQG{?1Dz?B9Icfw{Vz9iqB1Aw&Ujag*_>+o@lEDuUKt#;uLuVkVpwxI)NgSLo
z#1BBk5*+9W2Ln{e5=u2g1qaY1QLKnZ3?|Z*1@y;Kbez}o(YsXSGN1wsO4KhtRY;W*
zGX&72WH|=~C}#Wu^oLNwUCan*0*1)`KSL}yJ8oNh+oGONO-(H;qpiq`#V6GV0rXo`
zqM@Us_xAR_&%cHJ_|cW`X(9dj*PmK57KcjR)&}2K&%0d(T2lQO2$9=f8m-dBSTga6
zbS|f@o?wZqooIpe4xi_%ok1RHf;&>QFyo6Fe#2_cFJBHPGI(m-FxRZz`?Yt4ArO*5
z?&j)Ln#ae-vFUZ(Z>PmmZV5ehV}D{Z^xTv;t}nN`G4P(8oP;71Aq^JDrcFiTv6@fi
zi2k(qc)C6M#9|tO%T{7GnOWI(Ev2dXC!R`KN=k}CHnq;67iv|vN?*vq;p*?be5dd0
z{zL|R`NJ5?<n7r?qk5&@N`p;cjApHA`^)v{>+?flHMRNFU=?gKp6gYRa?9=Q?ct%h
znVA`dw7rO^Xm@Q+PEJJyQf7I1xy%84dlfpRoV%Bo@K3&nRj0_vNQLji!^8LY_fyJ~
z{Li%U#62%>&lf*jZVwfUxa8$01EG-<lai1LxNrNhzr8#j{N4)NvN16sR}y-tDk>W4
z?cG^zcG}-p+3B&sh)36hQ9wU{EX`365a_I{s|yK%!oy3`ZFP+#<l`nMhaCBV7?#33
zkP#nW=X$0^Nl8fyW^8KObCc<H?%?bkWVG4k-)OrAhlprmRE=bsb5_5oC%n1V>Q-1#
zkmDB88XFs{;A+o%)rX!pt)a8as1L^aGN-inl_vXlFsPBV^eC{7j5DWet&M4Ec&r$;
zhL?jx--&5dRaNmgY(?JT+vy@mQ^u-Cex#VNu(1WB+|#3*UTyc|)bT&=#x?cr>gwp=
z@1HW>_w5oqnO};CN5e{Ph;&uK#wg9|y?&J^;Is$PI$f$Z!oe|Q4X>+?YX1K2>s-lh
zw~k;FjD+h<REM@d7Z4bT3KAYMZDK8kY7H1wGJ|%rBe@fH?~=>OLWaP1-=P?in}bPl
zj;Wp=Fk2XZOCz#hfiO7WpjxkUu5?C1ASb^T78W!}HEN8*GBOAp{ZiPlv9Z}{n)>q6
z(&>#Zn2~6iy9_KWs17FefQDb|H8nM>`FDxI1_XgihiQ&EAr=M)6%^MOSJ6aSG0cw%
z1-O<G>SatmgNcdwH8{WM{z-DQ;z+0EOjJ`<SfjOlUHPrEMy_vbxqYVpiRiq^K6x^W
zIP_es@KQt&9gMYbL9DV~_33x}AFJrSXHG4dpDu`w)isQ*qau>%ePTH3tJLH4cFR7w
z+j6QmG-N&ta`5bI<e6eiD9*~p$Hnyy-)a~RItQ=65uG)98~S0ke7fBV=z8xfzrY{q
zB?>A}BLptGUqTQq6u`EzE2Ve#J$hY}cllziSV$K<7lj(Vij~91ONlt3k~f~CHJT?<
zSd~H?l#Nud9W5?e9@BGKoAx(K7OF(}Dy%=p;Nvrwrmu5JR^0QhEClC=%FiU_mQu*r
zR`6fD9aaqcvOC$!L#4lJu`$d@enC|r7L>1%6q1EkgTfe!fi{B(&?$$rT0SK@6o#n#
zIG<q}q-=%ta{Mc)&BZ?&hAv@~jW>WTYFU@_FaX%0d?*E_WH+p0uH_+qbm;;+&suOG
zJ+Ng>xq%I|%G->`w!Jn|D}G;kdwcwo6G)Y?uwRg777W#@b>fw;^ad;rI^%lgvNV}@
zc7If%y0oke^Jv<H>3kb&Pbh0DlK_H>YcH{Wn-n76tgjcT=U0^#hHQ<Lu+2=In+K-I
z5XDv%I8yx}hzRxK?3z#Q?0gHstf{E%KGZeYXj#hK2=%7LIwD;XusAOA;}R$7;j$12
zsUMqog&s9NDkDFzt435#6!!r;F<{{=hsUbr_T@^F!qO{=d_IrFjY`Gq_)T)|^{W-P
zMmIKMqCMHSn4k7wwF+`w9d~*X$<CLmOf03R<U|~-;+l(9<@Qp*kEHM5E1Qd5yoU@a
z-j@yX#i)bS5zSM@QJ;<r*Na*HP{X=J5@9#c&XMaaD07}uILI2D-Mv~!-%4Z*&w#Io
zZI$X;2N0Bd8^1zsQ?#{|zzEUQ_a4z8<ufc|;#SOvR?7P6HXIiO{B-N!j=6_Y@1ILZ
zhuta-fugTt#$K>fL)Fu*ht8u}<*L8uUv?zO*`l^MG>H$Uu}B~4t}4nQ83kd*HP6C0
zw964mkJ%D|+1i81UH%$WI>#7R;94AnrD$%_&5J9R@ijNk)mH&4UgGR9UHo%fI@wvG
zpg%Pm0`Hx3PNDGAm!J0BRvH{KL*A2Jm!_)eJ)}mVm-VNT?)3;dOk6<2{)pq&XrN8x
zwxxqrZpTghsDPRs6BENhah!BdDf($m7@Tvq{*@5;i_pcxz)n1wkT(oN<-DM~NB>H`
z{c*8Nn1mo`;>9GYg6$U?5y2S1vS4epxQFM$13mH<xebKZMK<Mu^}8*jiqV^`h08s)
z%m7xloNSR(XvPYc>@#SH3}C%_3-m{9?PcsEb!xzka~95&5N%7PGHgslt$-Asutt)U
zjg**~iG`z{iHWIe90b=v5m(bLemQ(vb*FbjQ47n(_KnPQC-29@QZmD;(_6=3^pdnc
z59hQM6XEPaL|hr+Vw0oHS==kqUmhft>N$AmZ|RF>W}*Iynz_Q~HProkHHsz;Smy*G
zl#@uXyh}G}Y&-p>0}Bk145^sU^})q-0jR@Bn!}#QkxI3U_0{Zd@#EZ-wpQ?kvEA=c
zj=%dPYOC$5ncTKTYFvZND;7m43P@vN*rA|j*WsKAd6^9B!@1-ccv3YzN_xABXuW6{
z{%AwiFV2iau}WK-@C}!z`xOt#tS-Oo)N@ISb|PG+aSXj%1Wi^pd$yjU#Hs|y2}~#}
z(}E00A@}=WpYo2$7%OU|-AZ38^CPtvij_Z~ACCp3ia0N0BXz`Rxo%1f@F<fm4!Fzo
z=ceg;cpj8v^PT0G4ftk$i^Dl&#R-|Zqsw>CyOMgjbiPR42V>7BE+kRTS!iAnQ{h<S
zN_;$@?<qf|{3>VTRQ+4HGxt+z2n4<04V)wH>ddmA*#5!N#ymw`-uc3Vy4moE0p#_8
zpI+eQ9y&Oi<hJSXdf7-EAMeGD(<wApHhnJCqrjduLGm}JJ(&qg^1DX-GVf66_S1_c
zfllr#nR7}9J(i3z@DaRPl%<(55`OpC&e<+C3;5mi(G}VxbcvH4zQU3tB-&46!L$|$
z;e4k#8D+1Pm~Y-x?|6MR>~4hUPZT)&Y8jnMmwePJOyIsz;9?N%S_)2>lt|sU-v`Id
z_LP{0Mne+AOM?aWR5IE*Hn}KiI?W%7A4I>y$j96^T(FVtqa(K#nM$sW|Kj7ZYxiT>
zpK5TJ!vxbAdcRh=_Y5?iG0CngoKwRe(q$*f8bv6^0YMH)(zVv~(Na~`v%3g|{yQ#^
z*7`}@>h2+<k&>Kg&L!`+(FVHag?yxrTl722;?H+vERX6;7HZsDgU^Sic>9Lv0hH+X
z(R}TubF7%#K7Z{iiTGPN6J=kw^aQk0cqp)5aL$<ax--A!PB$$>JagZMkV@0OP}SdV
z)*T{GmGh)MTL^53LqYTYv>hs+X@B)0I@!6o96m+X;L6|<sZ2jVO~idmJ*g-0XNW-Z
zAzSho%8Xx(@#n0BzH}>mVm^fAT&ulW<ueja%1NHmJY@Kc`A&_N^0i->C}VQv`m}2&
zD?{C<xH=!r03!hx;)(m-p&DsD?%FZ=qzI<5x>*%_DlP5Pv!<#Mp&qO}GUw^Z6lLWx
zX$b?r@$|B?V)&;nvbDhjl9&7>%J_xC5+TXBFH3|)TUNsDbJGKv1ny`TXd2%#CSI2Y
zdNAQeM?1_~S&O5E8R}$Mz1j>X_id2u@#hxJY#p!Ulw-LrOOkRzs+}RF*jJYEeCY*Z
z;M*zE8cc1Eo><yl^V?K(+(uQ5anJZaz2?r%fcvx`WQk2jn<vg~eEGxIb#e8SSYs8u
z5*O|(3ZlXlceoy}?zX1o-u_ozC#Tt3J~R4Z<#384rL_a;RmVEOS6(-waf4x4etRld
zqVcMUJVC0ngBKIEH0@&Z+I-*`+(LRP*8e%w3i;Lh^(wW1)S2)TiPqbKJ^ryJdVm}M
zHA23Tf$78Z*`hiTa#yw_xl6IXTp&KJPkMQv{e$D18%<Pm?xYv3lZ%ZLsyFEx#n)Vd
zNzeD(T5$eWR@dH?hN#R{%G~XxyBvZtN<9R;NyK$$1046S-J&h>UBYP^m$Mb|-)-c5
z!MZQQmBv8OU-g%3=&;3$ub1`XcKWhO^y+Vj6Qr`bNAZ};$MD4<IztpCEdP**;Xc*c
zQM&6<{jJWUhvZNGYGF|x+B-5vh@&WENm(K(qU--_y!PJHQUcQxaRdKuQAGYh0RNo5
zrG=@pBOl+6QDQ)YV%f+s{&_bu^I_x5x`ovioR6`s1smP*WCc3+vCI|=wHzbTK2Q70
zArTi*B%&95Ee_`jcb5gq%e47r<P}m!V0!2_o((*KFlTafUi~Me0`lxhu>8>0n9D^U
zoA<@M&IZaoRRn=h$aVy^sZICE$;0a5nK2|>qJI0jd%om1EKhAGFFRSPwa&Arww8Uv
z0`~~&HpRA|&GD(uud|@C+m;Yk80w%&<-uu%x(M4jy(^<$Sonu*y|tl(K8~OCcMId+
zCOGTf%VG8Eo#5Zx%SpKx?5C{W`0iZPFa~zqAsDB1bllJ@p?TmNmH!ZZ9lX0ssWo3Z
zvyr^9jei+{S||{v%rb^AYR|-tqgH=qEBhmqOCb5(Y##O<ufO%v)}i}iqYCeo(a*pH
zY|F-qe2jz)MPKiESb=@Jvtk&E&tjD|7@J~?Ac2|#=*mX+`ZLfQGU`O&Oih?ZOj{mL
z>?h^~8-JF^dg^lV&Qhi>`84O3?ia3H4te<YcSZ(Q6JXc1;|L9;fXjE=i?SD~urk8&
z_m5$=h9Mlp?#N;B1#uT~D=TffESkuRZ+0&?k-ZCN-_<(Tbh45`#ma1v1LsgGkBu>e
z*(EJ6Lk1+`+Szyy$<6EDGtM5mk2GXXdx-27$|apRGKkhmExP9L@RXjB2m-zuaGe(y
zGk2-9c4F=F8f$Dy%OEmEYJX-vIpb>$Jz$k)@$!;pK=@ICY1>;Tr|a}d4OU_BFd(=k
zDiy!Ep^Tq^;eCzjyFjEP8=b9<AoT8|(DyEZ(rb+Po#d&;Q(9ieZ}b+JMjf=vJCm47
z%|BAV`Ev1`W_NtQa4E8k=Y5bKcps1MffI9(b&`_Ynb~jxzI;A&Yk6~U7#b%l%f{`F
zI`vncj~p{v+^xqQW(2oJc3<Kb{vyYGbF}NanNmwW!2Pt!-Veowz0bWoPJ!WM&{WrW
zYa9o)g(XQgK_lL|)H60P&i-<6a$}FZ6$<tC6E;!P;TK}%p&!H;W(1O^A$?6B2HGu|
zn0zvL!l<CGQ<&lEg!kXt7*%9Dv&YjJA_?ff6N4qJri@pnqJ<HWVCL?lh9%WWi-C!z
z4H~9GY_j3r7na@fh}&?Kr48!L@<ghamY?FSCArirBYJ+xW(haqdLmwsj<sz@qc-jA
z!zYsxU|w?{V@jJ&x&4)<Uw0@!#QwrY>)#j+Eqm$Ci~m4&W30w%%%l0t)K0fgPZsVm
z+MS{8a;~wDi+v&()E$5CGmU3@`xk<N&v_fS-=>pzFeF|=JL~8zg5JVUdnSCVFqKH!
zN%^I{nISZi0ZlS{x}#NtmKjwx(uM2Z+xl`unj!j@fMDz8Df2YeAgZ$O*_KNg#%EA0
z*2TG$k0}@z{hnfiOqxL;1XRvotzP(OltQ%3!?TM-=AENXrQcnKs$Bl$WVYe6W8u?C
zSec6i5;Eo+aNnEaNk*-;kebs9>eEbKl7mcHzpu77GZ-9)bT_Nwf>2sO6gM%NkYC(i
z-PoBuVj}W4cHJXdvMovWXK7ADNiGM|gblY1@yijQ<X`J4H3&caIez?TA}WmJtFRrN
zj+nfyFPS;<2!oz=^L*AVV=E-9)O3OaO+$pd@+D}H;q$4ak7{pTf`~e5CA-k@e&Wu}
zTuXgXqxV-qvl}bwOo`y}^yF0k5a1g{&nfuRLGIVLz~bt0Y%$Z3vD7X4k%*WY@{6fR
zQ78ygD3PUsGyS7TK71u~+bER;K6zQJxd$h*0Woe5hSnid3(vAqJNbc#zh91wO~*eT
zG-Z)f-e=EHv!iY<u8!N;9pnTa`i))&ZKe1fwKc;MBOflTyX7$3H0T-Gn5=%Oq=nH=
zquQb*8Q~!oly2$YP@M?MH&-;PpsU>{t|QXzp;@fRkn@Ls(tqK3K1Z-K+hV(2M5zoZ
ze#g`e(qpML1lOTEQyy?l%sgw?ibB3n#;ZhA_?{53^N#;8*OI`)_GIOFT|F9cWq`3D
z0R0()dm~QgC2iGR9MffBNQmf+ArcC?c)>OOk9KN#=4!(<ZDWna>`{ZN=so(WC8C>0
z``_AH(P+e5-kVBJZRy&%?GW@M8|A-J{J0&IDU=Y`*(NxmAxYw9xQN}!;?k17Ep4hR
zI$!X_n80h?T+SCz7{niwYL+y0PH~aMCC#bDp0k{b=LDsl+9`g%s7!=nQvJb+{7N+Z
z1ixWpW^ymcz_D9fBQ!=`fA<b^<x+F&P&Za;EhSNUerEL(63m<xf~FKZEya*_L3Fro
zBeP{F#$b)2je4OlQRqmcxELmXRR6poHhF8H<DFjE5v^;SLdTMn&Q9V$1UCp{o>jcO
znUr#TeB#AX?<}$><UND7$o5wo4_i@Q#oqcmIUnEBiGa~7Ho}c&QVaujaG^95L+GAr
zro45jEsA<iqOb>JU~{QSTY95jwrWsRLh3IIHcUwarN=N|FD9e#HOnRJk_`T3@ao?N
zSx=Ao4%DVf?fTKL_IOT~)~j!C_plbKDSNUP1nuDY3yYIc?ei(ZH%AB>>%7x;zZ0+C
z$V_uJmS6hw8xSYIzS;XP>T6e8_gf%Isc9wI>Qb|fv*Cs>_8Q?5Hvg^|?;pu<WyMA7
z&-ol7*%~xz<7Z@{n%k3+2pHYoimO)d1;+~e52{D|nO{`}P;E=YutpT+TcX)jV%d4-
zUz_@2^^DBh)BTRsB2Q$B9df4isX6INY~r^5UN&~hru$Q!9ZeGjw?y=L5qhnD?`+3W
zJ1KkglyySASF(}z#8{cq|Aq+e4&i6(X>jSmTb+Q&)f=GKqlJb5TUAY#?@WYHxYWex
z^Zqn42fKA~d+!UQy~}$_Iy(~O3SW2Kh3F<9&6MPrc|kbQi%M!I4@X;R_4r~veP3$h
zrN;9NjM>v&<~K?;9A2_PA*eYgg}(bG4Qd78gW9i4y6#M5V-{b;R9k?aO*CXs{V^)x
zwsHyY)**ObrA}6OZS5hPm>%3_tur7<U|nqmfyb{u9joh6P@4nW{TsavYSuGh4u&!-
ze(2&7YfuWYq@>q)ld3g15<L<sWr-IO&*gNtDfykvwX63t9x@brv8FaBGQ211^MpQj
ze`+PR%C~lbd*$Td?Z-9_d;e&k)vbs|hh3=qj*PJ<kbQp6OK^wkQ3t8rX9dfpmF|Jy
zBc6%saAZv#4JQIPByAZUngZOn=ofo!`i1T}>OXu$W4Z{U7i%%Q7Iuny8>DJ2B3-)D
zXa>Txb(s4!)kaYLzj3Nds@Om6D=%F}_<%2g_Tr`-sE|j&Y3k^B-RM6l;V=8o^3(5q
zKQUPZAK-&zTWn!f7{pSxuIiEFu-5L4QsyFFYlrYZ7gHq6OgT2~u@6@Nu3d@N=Iy7X
z#}@7e+?O)Wc!Yb(ly;<Yg(%o94d=qp9ivR!0!K45S!PCnp`HmfZG<!UQ(@LRgWR~#
zM)cJFzR0c4eCJGRgd9}dL|eExtTYgQiTtHI9$de){^^8^Z^kDl$p;}SUJ%3^umjOP
zLJ5s&BaD6Xz0uYAH#Y|x>{jn)&s_yp9OUgbbmuQs?N~{S>q8a1&%=)-QzoNg3EOjV
zY2>Y2$YeKUpX_=;YlAp1QVuS>k#;Pt2}4MG3EfT$`%#6LSiLxXf-8-_wK3wrdjt)J
zMm|4XmM!n2X&ACeTV@jFS#XrsB6`Z?SbEn^Qir<VHQrHok3tunFC;ZkhH%cAJBkKl
zvU015)^p&z=Pd8)CuK*Zv3={*szV&K(<j7zjY==MVT9@lbSrfxidt>u(C@}0yO4=|
z@?%nNthZj#_eVy@ZfEzBM#i~)VXOQ+MMs9u?<jNi#}3a48{auj9g&5KioL9Rf(Y80
z(M^-g34bJL=U89D&%xYc?To}9e%e8fMnGp#2@J1Zw0E{@ze{7T=c^t&y_~UddtTys
zs90cUUVWIXx&qSMC9cNF9&$YOnNX=zq(EdyPLE1eL-Eq|NGKKigs*<tltUOO#*Rn(
zp?XAKkIs%mruf%=TzsA_{XIk{MeEd1RRx3b`o?IF)3*8;*fDPwhinJ~&z^J%5-)WH
zTRm+wn68|K^U9khCXhj^Kq`JKW8Zpx8j8&+><*nvz9_n{ZcF_XD3tJB7(&hdo<H*l
zT_~-}>AqCSn7a2{Nt7q4E0nMzoKdmq0ee*VthH_8d3P7ISt<Y2j*}OSd^-Q<P>_{M
z2Xkm%2N+y6G)BZlT3a4A42S9FE(o2fo2kE>{V;yb4Xry;B#49LJwvE*f5t4h+@Pnf
zFgNI6@8xl<w}-}JyMLPXSr3eYTR}RSR9KFfSaazox|f^t=z%BSh5AENi%$#cveO4q
zCcQwN=)MSw5M4BLVyoX*psc>^u*EEla(q$61s`;>l=`K@yjJj8EveDCJU7~`qW>a9
zpBZlwMFlfrMOar%Fre&_TP*9c`*H3sf6{YtqcFY`F|H@pVHqFWCb3aZ<Xy*&$M4Yr
zzLa+UJ`)Jq7N(>*{<!jK7?mfXl{`H+f$&o32#7bWU$lBJQJ_%)$@tCt@@>H@4xSLq
z#8$>ps9)Am#uS~+oH#sI2ARl4=n>}(K1biMg+g^qjap$%r2n-_-q8K(9jwm$Gf(nY
zjr(2E9W@oRd{%s3k^4`hK-YeVxf{j)?G~0{_WcS&3v??uN^Ar&*`m(_xEP)Ap$W=M
z)+`1p)mb61d}46NDK?|25Tkoi{i8?;skpe2mnASd?fOCLe6~9MGkWrorTA`C;$hQl
z+lCBjBCBICu@Y&Ye{~+@Y4Q!F+S3&Dr%utV&xA$e;>z}V<6`O|Y8InrT$X^!(ud#g
z&+VcWNRPvsf6KMVH2Wn8@fYxHN80sx4^u`CU~B#=JpdepM<$TJ#AZh=b7ic8KYW4u
z`>d!l=IPs?4MM~KUts3^7YkOtQpS;rg%6&=?TCo>IkEthH{6o;Ls(fB-oPxE|0<^q
zmmC0ZVwz_v=A`;f5D+DEUv+m7BOaTo_Q0qVg{AX_wndwR1d}h1+pvIx1Hp8&T)4vH
zehJOJK~)J*YTPf0V7?FPFu|m4+?9}kFBCuDMxq@y-lR-_uC929cF82!f2+T^jWm`R
zmt~7Qe}M{A__z$VoR$;R#_;d4-1Nx`Vtg>)tSpQNWm`)*q)^)`w}{_Fs{MX8_gHp#
z<`>A397Fvxh~7V+*YEi#gDPj_9NP*4ls26u<9{rww2-G?y24{0_(OW$qG(S<ga-*9
z(OkAtmPHeCG4=@)$(rLvLjDlOzhaSlo=rSt(7T<^%3zA@$CBbi>M1R4L1|GkYTD%B
z+3ezqYU!C<bB3&#SlZUl3bKWi``*{x`4o(8MUec-_<9mc+#HaI!<|OXFF<D<i2E|J
zJRpy<q``S29b0V!*3Kd`d?FeGTbWoI7N45vuj~lW%S&m&CV0q~#I!tgfSzUnC;pRp
zzf$!NziKpq(v-2u?@@q3Np*pIcNg`LrQ7&jyREMmYH+Ck8>!lPH11<!ko$oEb^Mzp
z#T*7;hEKp!aSO}C0@}KufwH#(c?!_YVFX|R8QFzFK%31#pv+(NO9mjX&L4&_F{Rw|
zF%%(y>=LO+QUKJIn+(7hW`|S;K%2kBfN3F@e2xR~Mg{<N3s`RB8G$z5D2&`JRDx{+
z6E1&({LJOk!lADGwG%4OMyQL?Z$KA0P0;jq%G|c%mk&KHK_?Pd4n##gmp<pItIz!;
z!aEF;-kJ;TI0(8t_CmxJe2c6oT<BfFn#XG2mvR+F$G0kgpeNiR+BNLg!4-@=Zh#3=
zZ+xM0L1ApkOid~NQri}$YOsPfD%ia-{7Va*5(0*S5=Zg}1w@2gu}Km~aI?0!rv}TM
zSTK*2R(@kR9;?5EgC<x|lBf`pE-GWomYJ9)nHto&3L8t`_a+rMH%&e|4EtFySOyM!
z$#AF-Eo^ml6#|(Xy`u|l?QzGZW>;@M-Sd&ZMm=0`_4A6pqY<~wVK~cm9mc1Iwu>&L
zy@KnUKM7s<Ox`ZJ<!*b+MNXUuZ?Fiu-?c*_62FTT&Ot#g?{q&uRFuvAf-0Wt8|~h%
z{j()+C*6D8U4=sOHr43M#@ti-?am~onT<PtftsyZcjnUfE5C9^_nB@3S!1b0vBOLU
z?7yeEr^b3NQ(+uyqRRS*o_}_V)Wl~f8y2*u6qYZ16c#jhWoGM0zu7$AZt|Y4iI|gq
z=4j#M^~L-*E@k;}U(lr^#IL?0`7U5>xG-gXUQX%TR;?cWR|U;R4?;Y9p{-nx$?}q!
zAz&&I5FC#~{HCeu>t+Tr-(_En3|3Q%g#@ESC;w~|%(2HQ?G(JC>e+Js!a#(<S-YH7
zF|N@sYV52vQS%@}SPl*5mWgzk2O$=1{|U0y4iBw+7~nU3Hy0Aj9TjE&##MbgTy9a(
zu&+(@^XX`Mh((jFjID^?vfF;<b6bdVlBYIWuCgT^+R<pIiLZMOh^pGkD)07Ap2-e)
zY9H&%ZUHR%|8$+9BwQFVZH~ZdUYq~y#0DavctI-Ye$gX@-9oJI>}1*ECu4yIN}9z7
zV3NAQR3%a{5kYw1g0lc+CKm!?9PU4e2%(i!7+~jg03$7c9Eyhk?0os-TJS2PA_uO8
ze;`0CVr4YodNGgolL(JPLwv3E{yqU<m^JFXnya@_N+?&F@M$QDHZkqH9@?fq*L$PE
zDJ)1%m_+BsqzQ!bm1>F<7Oa>;Ox-YcjrNNA9k4jTO5h^%M7%TRmUUb`rBJNlJ?NlD
zik4l4BZ1<$vS+Sh?(<^esLka1B2tK(@dEC7)2!CoLF&SO7#Zkb1Nn1)Wwp@JthkhC
zVV8~pu|eiv0jtE-r{e!;Xd&$A09%QV(lW;kYNTQ*Nc+4QE4I@%j;c2i`%7>h7H7@F
zk`~t$5BEghE>_qHj8=6ayIBUfqo|PRW2D)sf(m_vaxfx*8B>_x+)3mUgZ&dU6;Yx5
zSGdO%GGMg{taU2KiZ&!4tnlS4=GI=l1*)Fj6*U|-0Q{QjhgavQ3$MrgZ}S0e7!HY2
zFbUj6_6ruSNPecgz_Y{+eMndW<jb80o&Ios^8ez20Z1;9zi~R2`ze5LU*Zejh;4gD
ztwd2i)T7et<g2Zz*k4VkL(i-${PJpVVk7aMpXv%$+eZo*p#!vXe`rmB$39HQeLBNL
z)P%~K79`3S{Ekkpq=&xTChhK#FZ)m02Hc{?at-GGn4I5{gNy{A!BRE`B`vlPx3z7b
zDK()a;4UDdGjGh!dek9><<e?m7FNM6Z0XW@q3P-QqXVNUA=UXIRj#N5c;ZyZA3QOj
zN*j~8u)c=CGE~-o0KL+1dw+TiTK+Fe<PT4n`|Vd>A0zRAsf?2Rs|PPjUDH%B6wnFS
zO^#~LBuOxrufR4fSEZcOLz*>E`2t%C5|8%@Fk@r=nAtC|F=8xLmX!IX`j}GvM}(j=
z=4(6o$k~#`N5XW9gpVYGxRFE^+=)_BvV)k!5xb(Mq%_L0Q}P^}i3xh<tg&G!&Bc*n
zVW759n+@zH`A3mT+Dt8$&M*(ISu94K=@``^<k#2jl5u2jqk6c3WCKRasSdy9cW{N=
zeK&kS<sOPOj)MakCQfQ=d%IBB_+JSAXcx7b<c?U=t(x$;94^2|-s?}=Eks~f;%axY
zc9^T3E}kuqi<p0Q(Fn^RFXxaN@0lA|A1SRhEIPBZwd7)UR}5Nl7Yk@ksSiwOT%NgQ
z${FfY`HV&|tl`3VRxWtpRUqb*Wk>};J!7@>Q$|MW(dAXedo|zj`4yAURPy?o%ofL!
zU@>rf<=B*_`o}^mC%eScPn#T-z|+$uZBaYaH5f^8DXvOpMMo6p<rgGa9h@!piJ7r`
zvEg&z>m@V~^4SH?#luRaI=gA^*u%rpFI|r(rME@!*UaN1u3SYOm;BAaxf*Z)35x%d
zfE|E!n-Y>-NlczUo&l`nIQ6Hd29jC_0DU}{`&HQY(}%Rw6}(&|y5I?2r|HTOL8Aic
zS0717d}cCIM}fy{ZLO0^thb0c)W2#+>$S~kTfHOG*y5H){s7_g@!99pdL*3;eEp4w
zb^EJ5-^{>frh1HxD*xFV|4AlN=im%QUB?SN2Kp}_>N)q5*0d|ceN|*8TK&Rg_U}0n
z0Bl~~?+)%s5uEYgbsQq&X;JHcVJ0)JjjJb8a;Ul$y9Kwf+kU*Qx$yWl7h071lz2@8
zDS$uhuFV9VO@GB=BrsViiQtSI0S?yD#;Zt=iOFy$n#<G=TG!V@G&>TFaGQqQ1K`Ie
z_sL?*7VuwDYQE;f9Z^2^q(}WPmB5+*s!fRdmsHEtNBU^K$A&}NwREVjE5JgsxSTVl
z)%q()=&1<lEP!_hO3Mn0?X~8hryShV?yfwF^7!}cpB%pr`ak>?(A99VQ5pIbhFTha
zV%tqx89mwiY}cu%k`|%=SDHcoOS$}=(`jfD36gXA+D#e*gS@HJUy+UWb)@zhYPkWA
z@rbJ?JCgvjteedaey5YvQ8=s0g!w|2ueKN$NKOO<Cy&uHEh~uIBgKj*S$x^o8eD5G
zo3XRQb|bPs^^ipaoi==%xbZy1+~#GBV^waYBL?TFVlRY?BjG&wR&7|V9dlPHIV3Ho
z&yIIqW8xBi2dAvff+MYHdg{=vhEt-*ry9nVre52_r@}X`TKAH!4(N@%H}ueYX-sua
zElN|Z2y|ZPNwc)>Zf~@m8V!b4O3<xUCWBfzQTDl1!*azvhb_BykFcd4Cd`JXT+E0+
zb;r>677>6@s>w#b;n<XEDt%|StBq`iuS@>va+w*QBxK}%ISRNWc&&3iJ;&W2L{L)s
z^awpvvDa+Kj#H)UE9ac&J@+mxjsC($HoOQ{==9*~HAwa2O(6Zfl-bzPv?8HiaPqY9
zkuvQs2JML6@tI%oYRIc6ueLuaih1AUyT7>`Y@`%WRPi$M+wi7X3$z$*(7|_MZnY^2
zep|NVz!qti$0xjnb6Q+uhm$q?cAO*6F!25Roe&;;A>*RrSh?&$s7*6xOA-C2B$R8}
zZ6C_o#oqS4?PU20WFf6niA30qa=X1~okkHC4ttlKj9)Dn=_xGi)}J!d0Y5l<Cebf-
zA4O73uRnvERLtm_Un$_4wyZmImQN%_SFBce8m7<Vrf#_78%_b<;9A&r+gq<0E{Q$&
zxge3i@U@m^lJs&RPh5YC=$M;%#-{D3tUllZSBS?x_m0x{@gY(Kc%P5mNNKArU7Owu
z4UMczDAH9)ret%BM*CIGh5rNM-_X{m;UZ4gc5`TSirVeI;~h`|^6_?+OFD1Bfo3*w
zN>kqX+I^Jytb{!pw*9Qc>F#k+e3d<&e4K*T+z>sPjwQ)QC|VHcC%*lGp3l8J1d^3n
zh{%*_oV*}>T{o}pzmPiTik!hqQssA!E;tx&Au|ywQ;4=%nOgei_Fm;}(c}M}DCZ8n
zuy3sXTVXy#U)%`^eIs-M9u<=4=*=Nnl5IAMJ3}W^{@%7W{=LNpeXw?Y@Dg44E~WZ6
zKsc-F?OPc<!3Q`GVRG>s5^ZrDJ(olQg3_4uP-cg2rmr#)kE~0{dFfZIw+h4vfEmT;
z%_p0g>~EUlMM-}?zTgCjIv((LF1<k1AWi}m^A&SLGt6P!Xz8a(i?eN>9=Js7$2}B)
zrieh+cHllRV&^X4*}q%cv&GX}nPayJP#@j8ZM+iE7ePB^#=nRdgDdz`%jE711IN(G
z$M(jGOM&$C$nQw~+`BiZgAU)oJnvF&&od#>HTJXCr7I!ef=P%hp<(>G&0(qKbrLRD
zV(gii@it2b@uKOGSB}Pnm*$vdOMiiU^^9~&Yy)B=ygK<Z^*el?EaSnCrWFxGQJlbs
ze>r5R2ttle<R6yPT42Ck$4qNPE3D}KS4OjK%>S$*$7AQrv14v|xsA}2%Kc^fen>`R
z>W3P|A?~Iu^!I$5?c%W7zJa}#5wke9WnVFm;@5G3x3m)v0+*)66-j05pCFqKl+NoW
zY^cJ^L9gwf(mS0kyqI<in$^dX{#BAihllifnEfRL5rdhj>0-SmX3Z)NEr=}e!r<@y
zFtK&)z5W#tSfEqGUk6tvX3$w)lm9dizNdsFmf(@M+H>TRf>vJ!#j_drHOc=;d%Bpo
zp88U;>iSx328A!`cN-27Q9BUQ5u9@E?<+5*)t}7Mn<HZ8z;>Hth2Au$kfr0SN^vx$
z_!ac|kvE_zC802+f!;cC&ft!WzsUw8km?v_(ZM~(arwEthG%(ZG`c|ocOZzqp2@9&
zvG%Si@`cI*DF=cJ`4iS(w79sjktl4*l-8rY!PI`2<l0`^%*bGP(;p4G-!WV$lR!=D
zMn#Sm8u9i1G~rz!rw9zi-B~0`9K6ThpS*l2BT(fCx5Hv9lOEdetsh&Q-fnG1CF@PM
zO#S>VgTdFt3=1#VE;Kkr_WQ;lI6n0KWfMaucXi(Rg+CY}XjmPjQ|wN!nxVq>$rSca
zF7#e?gU9@a=DvZ|u!}aP>%B{Ai}sQ_VY%zEB&E1n^Py6J8>q(PCK9xt88IP`V0aCV
zV^=ZzQL(hOIF(KqVG+seJ6<6<FJ#Rz_C^+hkuas*+pk9dRi$hK?6c-R6u&9OP7LEj
z%<WZVL2K-rzIV_O3BvdDi|SAEv|@UQ+YL+<cxaKZsppf2zo43!f(Lb6AG9lEiJv~6
z4={6h+pY)tZhZ!VI{a;MZ{gw66di6Ao*dg?GjZ)1E1%HTQKkvwq)%o&y#!c?-ivwW
z)sux3@E|PU2eNUF#(w-^<+|nz>eKG)nZwF@A$Z=29$tz{gYP?AN|7c`7`Indrl$xw
zzqq2J#{SH-J{UsVkD%|5SDl<)YVEvdE814Gm0>+bH!i!eN_m5Y`avXl)#s?$Qr2f(
zR*Yg(PAbRGE||D`9_KSs0HUEsc=Wv2ynPaE!$(HvUB$8wY*nhPyZQw000vZwQ%l?h
z0uT%!-vI<;l^PCb6(_7C#;Nh7&$cfVJ&faY+Sx7w|3|s6H1CeuE);)1G3jOwgDv$M
zpQeJS*qs!U-N`T&0g+%d2?uW*$E2va+Q2Sbo}MS$FPOy`ge1WX+-(|KXcGu3xsM^W
z<`IMj&3LCLD?t;y;$`b+&kj#N4^c#BNMw_h9b;7gL1hU5@*)@ISjd7doY#tEXaJU%
zHCgnGtk2+~$D>(j6X6r}BQU;Y_>}rTJU62nk!7?c=^C5JMY}wn4JV@#k!OsRc^D)=
zh(Cn#-#BTdN3Zp4@gsY?SUCsH1{m-M3beV>A6y{19dDT^&yA7v=;t&v+q^`%j@Dh?
zlfdsoaPqgwBepq;DnpQC`;|(cds(i{o2SM@JUb*G%5<Lo21l#%!QcVk-7i;FG>gD@
z)_$8Yzl>R6edii2kfh-GSxOMOpn0tO)F^SB%s9myLE1Z-%Muw9GnPA_uR#uKnYMyO
zz7%Z;wWM9bsnU01Xw-2~Yz{+PV&UPa%}w)XegXfLS!Z8`l}NhO*SF}Q@@6F<W1@_o
zA$NM|lG{;2^VFIwY0Y-{TZKyB=r^c%iG7V?3*}s@#N+=VfsSvfN;1;IL?n%{h(9TU
z4oi0WFK1`UY;?PZpDxS{o_7=pU9o_m>)oCw0C>$B>Mnh4UP|4mY}3oQgH!v_!J{%*
z8u!b!ZY(!0qA0znP#4)0uh0;o3~g5><H#N&Nc0MbeT%qDHx!ZeX8aOpjL^Y~N}AqO
z!JeJ5rTR+}ih;d}3O0A0uHy=8o;CXY7V6E^H?C)&u`uT-4Zc5Fq*nsH_Uir9&iBHS
zKX;K%3}-_TS2aHOdUq#Uk|!q0>dp!$s>V5ep+@;3RPTG~T1a0^Upo%p$A3JEOn+-e
zP89#$d4TMCQ-0mG*76gQM<PT~sL{}1#`%x?yRGQ7oW9IsX(V=99_M79++{}#%So8c
z5fMH^k&W$&GunxbS8i2Dju4n^=qTZOgC%yHR^{@cO7vg1B<(xS5n*QO6sZO71o4AA
zdeaV%gbli_F~gW&^EtMXJJgJ)lXF;*Mr`#vj)bwoZQ{1-QIXCA(nXDx1lP?EVvq;T
zs-nd8da7SY5FVruzdkNlE&XDtoTM*P>7lrCJ{QA*9s1PBA-(JyQBgTbRz*-<>)cBZ
zfrIcSDgrSIT87d+1?@G3R6s{p(fVnd8I7m*Q=054-B2-aXl6!PJuk!vZr$(km7qNs
z>xmv)+Ea{2X~)KQr@xynJZBSRK}`tnlRp|{gBwSY&O7dy@6C8I9(1d27*ELpeV&2n
zELB!hgN=c|mkCt}_4W32#qw(&JCI_8iP=OKt#}1lp|ff-k#G9iGr5`xh5CVrMt2)_
z3?U0%0Gq^T-ZDi0Oo<|nDTKR_T1|<R5b(;qB)@aP8pEc0$lIB*t_W!-EUo=5;`PT$
zW#7^i$&IGdZd7SGWM0Bzy|-_}VN&VXc9YDHbI#&B*U&_60}n;Zp&vPVJN6oIJCsW-
zkerC&_sKz-kQj;S4$s4<E>oO9jOqXuVX_SJtruyrJx?HXL*!Be)ad>7(-;tt7j9)o
zDDw@MXthC+P;Eiam9J{NylTHCM^H1+H93}l`T0G@Q&N|@Omz<QT^+w4TK=GSM$Ll8
zl(JW6ySu!G<iLJlMbEX`<j$f>`r_=BG31hQEFJ5WBnn}ugf~OulB|qJpL7HRrV?VQ
zv{#?K@F~64g*Xb_PpS1Eyb^y`(7@nkdAJNYXN__c*0~<`-sLb7Jsb`Gdy8g`n{OxI
z`n|)F(3$?;4K}sQ8_jk?!u1exqY1;-x>xPj>9SW9)A1NY$;^AKy*s*yg}9&d<<gez
zYd!g5`W^AOHKc`$$<k~!ML3WlC*SlkgL<{Fk>xKAZoaUS_cRf7+v801w)^@yJQttd
zEx{p2*1kF8yME3J)Svfl!_H)K7S>mDp><;G$%V!~;JbOrn7q<393^+gU(Z>34--%2
zQVGR`p&K>^hdN_??>iEnGFJ##T0Jq|>ohiwGNe#_i1oTmmY&abB1CK0dtR1hc;jQO
zZ=4hkWl`JIp>VFBietu1`AP&l!-oZe3);;-W=jx&mW^j@;o#nqa<?sEgzGWVU*+B=
zTk<9~k}r9{&_6dkENXp@R8XDLsR7F-M+ITG`SvXnZayrkHd?qcPV?j;uOoo}PW#H{
zxoYlhXiHUF&Y?W@xpYq{Z-E9n=ti0_0r#4^aItCBXXQ|k)Fwce`@X67No%5sAQ7A~
zUV2=h>vXq|-<sk`VG-57>n)_YFPDw{x^rnL%Ep$lVgLsVm%9ALURQefG;?EEbCe9u
zYHFekxyKe%K1YMvPHY6`Vu3>)S+5c8jM-l6ak?Ayy{`5$dDe<%f*_!nYs|uiR!0by
zZw~>|%fg&>sIS9S?0P=OhQ*K_h&CWYaCCT@Z3ms)5zN-kf9`redJ8pyWZnXz3A3j+
z2Zp)+cIf&hUoF09>$?}<S?cAFe7@wbg>N6&>Qb)wQo&AAB@bthOKY~Ox8ds>(rS}N
z*K$gk`||g(je)TQ&Xo}9y%bV=nn%!X+p+thYE&o`%xrU$b{MIA4>gm`d@v7<-hmjo
zqxosGd-f5~NSo<8&1sEv6QUp}KC_|e(nG{v1*5zYfOtZIqc{>QPsiuZ{M@Uz&O)|E
zvAJ-U^Ua}2A=&CB|HTfCd2y4K@=HAs_-XIglrAWSWK|X=9J3iHEVR38<p|J$IZw7?
z1#*YSvtlM#C(cV_h@SoC-;+iiNIv#`a7eW_s*JXwpBM{f?4hRXir%+QYc-;eItx3Z
znt=H1ZO~p+edIpd$4h5B4FXb}7P~?x{;%qWQnSxhBLi@PF|+y*Vh^$lTA7lmk0Fjh
zl2b!5qMUClZLe8Oe_AbDQ;>p}r<=onfcqMVL`sSkvD^lyM3qYzhbSL=y2}L)$0wxl
z!RW{QxPf<ov5~KQekf=QnPY1GPVz1tv0XUm9pNv)-b#jZyO@$LZ$G4NVpLJyOw%Js
z3pNTDzp@v4#UN874%Kc-U-LC7rqmHOuT!i%sTA%^CW<{CcV=I$(jdUvb(Q1LScv?r
z=?Y)YM3L2Y!_{Y9*kR)%u))dLV;=joylqQRPJgWFX5nY_{i8|D`>dHGhap6GHx<^M
z{fYHCg^Zk0HhLi?4V(zbLKeZZ*F#=gxId;?WpcAst4m`nyZ78Pj8J8F7rNLSf*$_w
zN9^^*lv?ntUzZO~*WQ~1Xib~)ZHamadQ0qQEq9fJPcIw9orQ7-z7eQjI2l8yGDcr9
z3jKH7@$pZmqaNt}VJHF{F}2X#9lY^~+<8{SatU@sEZdLya7zZa`?GZKc6s27`?3g>
zd6RR6z99(XnVvwAiA*$QRL2J-*m+fTjz{k)1=X{QFu6Kuc=$>3)@7pk*GyNx`N2{w
zys6x)h1!b7Z6XC)bStB`orTN_&apG~!Rl%H*O(jtk$!6YI#g`3m(1cU_CM6svRp4m
z3UbgJ6Fn{Q6A^3w#!#S+%1_pg1T)#1DH)f0^NfP1p?%&q-KSS01juQ>>lXzzq!xE;
z9L?|Tu5MxKSjA<ny-KA4jVvTDTk~6-b<%)2@>ol(UGMs2XK6QQcZmq{Kx8cjHPGf}
z1mFo%1Nkr6iNz5FD8%gxpcsLdr1_>O^Af=dKS7Sz>Z@S+(5Tq57g6@2)xq)>-TO<?
zxANwk12WJsQ9x&`z)BG4YjVDq{?>_4HAeAog%PY=bCJb<lJWDjeA4lXcRPoP(c6j2
zk0Os%nstCwxCRh{y|myDDMW$K5k#!J4e8uT?DW=LBl$Ph#NdF#S?j~$tSb89aF)x+
zKxt4)SUpk1(J0*vwFr(e0Q|*tAFl6zIGe{+jImCc$6~mxzQ9MV%<umFu6nH0&lsdG
zs&EWR)^_Z$!<Y!D2@j1Mr3h&xkh8)e0*LBQSr~HCwzdVZtvyV;q#nqUIeV>;MxRL_
zf2M`j?-D!<gPy(nORRm3l)Fbce9tJ&I(;zw?I8)p#=I;f;6Vp)sc}4|vnCoSR96wY
z539M^SS<{r7cg|G4^Or#sm_!X;-i>6;YEAU*n|CNc)3+IB{ZS60PbEbXj3S_;ZJQ>
zlS0x~!^-J~4&aCqQiVgQNUA`U<?uif8`@>x8VLq|jYaVb1g8PdSZ!d&Z2x2livVCv
zw!8kwMTK#e5X^#yB-l^j1<)ojm@a@#7syHB1OcGK{{buI>qR}t!9=p80e5+ehzMwl
ztl;g)5fOd;D?gIYU*Z_mb)3#C?v6(kTM%Z+;!lF)N~jS(1Y5<V`7`whI+;>#wL&rF
zrOJhAcO@Z$B>bk$|6tk(?EbKuu_91IqpC-$j-f<FA@vWcJ067g<n^k=W`0;jVQAVS
z>x(#Mm3K~Wl)F;i7Rlm)ASBui+mw8CNt?vr<LKj=SghcwjwGkOn~TUVC{72mvObbu
ze}xwqqJbKb0BLF(mRh5G@ly5aS*YaV<_YTTRBU_RhZWoq>E+|pczwrxd7RWJ`b*p^
zQ$g;7RT9N6W5M2RBvUJsNO;Apv4Rc>C?MKyJWc|X(&Ppak62V}Mio9CBm8!LgHd@k
zG#>Td<obP%(w5r%+?tmX-;tG-V^NJ1)SQ(pM-Hd>?qGP?r*78uL!UdEL_KBs{4)Am
zl>e|=j3VN}&jLwxZdf5NN4!8PZyU;&a+{Q^`Emf<v23r3g>V^yNr(`@BT6i?OVaNz
zygBF3t#lhsDl<*%HQ>UqTowVDyKMn38oZLFw=3}d8#=Vjo`n@PiaEXMID#{-i3N&;
z?6uD=os45E3rYfVDhrsdN|r68@<#x=>w*VORo;Q5fdv*+Q2irFA)GgVlpHin#BpyV
zVSC%KA_xluBR(m~i9B-GJPyFzHZuiv?j%)C2Xe^B(dyrP>g9j)1KF<D)+#r*ebPzv
z<$CR@!`lnx+7D+dgVL^&UnU{U<s!|xK4+SNk&}~eZEcxNq#sS^iaR;o)K2oB?C&?Y
zo-Ob0?gII=EG)Gp_wxGsfXnc;+3BFIz1_&rFsAtB#oNm2<o4Ftd$7MhAt6C1R!HD$
zWpGdsD;pb-nMtByYD%FDCLka{L`3u%dJP&@NJ!|i(_u%<-kz}o8Ud#ZBG)bhol(2P
zyLo~|=o2xRCAx%!#L&oyCy@L~3`#xL-)}OSNH@uQGnUL`WICQ|VrJ&{_i{@%jeV=e
zZleRH+3VpP$T*fuWrYp50}_}qF)=rM9tga%(mEdZ)9UJ25BZxq-`}2BS9K0~+$kt1
z=(Xx#mKA8R<TH8y%*{Cir}7Z*YrRmM@7=sQ8ylN)fsA4+3`VRGn9>uF;7D<KHArN%
zIh+Xc)W5byki_S8PfJZ50Ip^I_VQ?-Wd#-Nveg6Wyl3C+d^B^A>4k*k?&;xCUss3E
z?Q9ODzg~7jyJf?DdWaTy<FsC4G_MOK^8Ndhp`)n0JeY!j$q<6#`jS<z!#f35Yy*r$
zki8ne^Rq;HBCLp*SWaoM2-C=FwGs4_GAJmh455~`_Lg5m4@W$K3L1WOb@i0g7+nPS
zmXVRs&gLe_JXGWM!Ts5abRsR6$MxqH|HD?F=d(ty`%@vtFS6dbMn90U3~8^YNj_pG
zg5)Kg1oeS*<4>PHK_lVga5;WvmDAHB^wf@lHwnE{Kwyzi=ky=V6^}O5LImA>9H#uu
z2>bKA!Lh2oK0*7cZ*2MWPwn)l+Xp)q=^mVg+1VQ)GkS0gx9+nyE!}WQx&c*|oz^Rc
zf{B9K9P#Gq>C1{;rvb!rsXD`L-tqBqPfrgqbjbmbQT=h6l$6lufh6%Lhwa1Z+;5&o
z<TBPgkiZXRfNFmH7Qmxh@>G^kAT<rmRlC(9Jq3vALe*xK<$MW=aESF%)fTWmgHk<3
zin-f6J6q9=j+WKJ)w{(eV0BN$CY$m2-yo)j9i5%~9twZ^hJRxE9LU9R$mw1qX&8o%
zZh2}F8U^HN!^6Wn-N->RNr0tdj6xEKQOaka1Doj$bru4EeY?p2&lsz27kExi5d==B
z7Xu5{k~r2WjKJyf9V)=3BHpu9x<N}tP&EW)#avQ}1QysY=75%>gfpgsjt0;Jt~`1?
zN$n(PE*`vOX%CkM=y-qvPvBaV=_a0Hz#`oWw59fWr~@!7xHN!@@f}M%H-Wa)T7u$j
zJ<};rxgP^8_m8RiPI3j7`{zK*nJPsCKt}~Um;|&<FLRO(&~+t#pv5k$8;pRJ1H*J+
e@lgo(!hinPtxHe3*l{dm00K`}KbLh*2~7Z+^H50u

literal 0
HcmV?d00001

diff --git a/docs/examples/op_fuser/layernorm_mlp.png b/docs/examples/op_fuser/layernorm_mlp.png
new file mode 100644
index 0000000000000000000000000000000000000000..f388c88fa9d483f72b2483f9973e92483cef066d
GIT binary patch
literal 28980
zcmce;1ymf$vM4&Zg~2VjySqbhcM0z99^Bm}K#)LihY&mv7%Vu!9R`9s1h+TYXXos5
z@4x@8_y79qlQm4!UDjPK)m7DrQB{^fMShJ8002<sWF^%B0O&~o016fn8d8(!mhKGs
zg0&V`5(fYpl29H^;UIsLnaipx0RX-<06=g!0B{ef3f=<%JlOz%0}}v1APWG%bIEO2
z6M{5^Tk6VLDJcOMAZ0`V926!122z58`~yI}2K=T5DFNi62>)GHhobu%1|mX~Edcg!
z7(K}M?;lLa=Qqy3zF`WW{-Ia^{RbL)vH<2!8R|C$z#5m~Amj_lMfR;bq?7%>KTt7q
zL8p+yu&t)9hpv*MfVs0Hi>ZaPnI(&lqswnBfRK*>r08hrVM^xX=-}io;3G`&7lZ($
z{JWZ!g6uC44|`z>T_sgA31>G;G9DH-7B&hIWHK@`AvX&v0d+~~ztJIo2~*g3c(@3#
zvU+=avv_l|IJ;T1vh(xvv$Aopa&Rz1Aei0XIeD1+Fgv+Z{)@;TI+B*|=5Dqw9=6U-
zWWVW}nmK!V2vbn}X7ul$f63`#YxNH&C-=X*1?eE`?-o{e7B<%Z3C+^S_WuU$cgw%f
z{_5Ai*a`h6Ch%6>(%sp?^S4+c?0iChariHl|H$_*gn!_*oNPTrIQ~ZYZ`J=DOZT7l
zf7twI<$p&|akI6A4CKG$`kTjp*8K<k@7@Wh+WJ^J=t|l;S~|J^?h7vmn-J^&*z(^o
zC7d0c-85WG%`HXP|3>+bs{aoC7oWHP@Zn<P{!c#t(egK@5bJMk|A+SfHMRb#h0HAx
zWFgjn&r=cPK}maF06+{NCn>J!19g;#;E&zEJa{wZciM^Z=Cm^cR{)uU0T)|JvhQBU
zN8DDvF@(<K)B{I+zf&P<l3chrWzFy8iMs00*PFlg$mp77BH%WBaj{}OJK#Fo+REC(
ztu42Z6oU*}G8hpZib4#wkIIC`YBQbZKdKIpl0o86f44^iFwpY=^hBR1OJ70Ce<P~%
zm81QI{#Vr}EV2j*kG^!MKg|?k$Ou=zss9T@%mcdEB|0&S;~%!N-~y39&B2J#%E8#c
z9~c_&f24|raGXK-hu;r~NaO-$!~Y0H77=#;Z*eHd1fbOUBxMu{{t>F!MV0g)ev-6e
z$WeRI^f3Px3c~RK=HL8+_h4ng=)~-n{|E&cgn)ne{eLkCxSw{#2=HTrb1Rt5Hs!Ng
zIcPd#hpH?YHq6UM=}D0=lG%55;uCPTtOjrS*)Wt9Vg0EzMHpgxkdj^4_}pTw7QTSQ
zX);Hskt1VE*hBP6g>v{adUGo*hq)3Zp>j~5+y}<P_D_a>aacR#DCAY-zo3(W&(M(W
zjp3kRP!QDlG{1znzT4*1naa-NR;+Nv$&t4=fyRyRB;}mSu(jUsr|+Pl5(5<?feF>-
z;IV+kF8FG7s!Wx+6$<8FKRK*%oF}<4Y{G*Dr^h}LP@CJFYf}a*_UD9$ReUK1AD9Bb
zkRb+t&{)VNQ%%htix~AZO)HsE%n#<A7Rbt$6^KIO<w8Qhaxze>qG@(12uUm-qcz*C
zcf>DhcHQ>SQxlJnXE9@<t*otNX0FwgZL3x8@Ko3?(PBVZ$tr8!znoU1V|aP5>f}M_
zK~kt*<Uu9dEgKOAE63A95yMO*3uYT8iKuv+XRYpJIDX`CPV%zeMmYpubms62t)cAX
zv*mY1=AXL{7Yj-XR!2V{_V%AWPI{c?6z=&tMf;rlJEpzreY;6TjRs1zPp>M%f`;4m
zi%Z#tyxlZ5FBSm(5jdTB??3WqmD32lXv?W>m!wtXCT*a%rr!ZQNIb~9(AtzDgGE5(
z+#=5R^`4JGE#{4{q)W?sKVx-lEpYr?eVF+4r3od`!N^a!JN5DTxWDWnkhfxa{^jO&
zF5ugvBdv%Z-+qlu(5yV)*BcN}2xNyGIWsK(Owyp4t}{W@$bNDl%ninII+qa)l~Da2
z*NLsgmkcUQZ7UXTI3lW&^kktBQK+oSsCx|9oGANf`O<W<S><lmE@d%Na27I?{<f3U
zx2w?!sWLv|m%i5p|A&{Iiv+aeTYj(g_r48N?luc6O_Y`#*~4_h`RJ`WDrKj-WhYlc
zj^8ITl^<)k_ym?mAKWw<6H)>j_V#!c65a2RfguWSdqP;k6N@+GG6$5!RKTiw2A+1#
zZ!8c_onRyuf|P4{;LX)_^rNibGfP-Xp^6#{A~5RvDRd>}pQN`w9>u2)IbUD=a`(9e
z8=o3f%vV)AG7;rgbK?Q=qaLrXq_pd~wDW2G0y<vi36BgpIkSrzn@TcD*UMkdz!fbd
zPYDWdT@Ve1k%8yoFvq=x!ApoN=Wx}}>&0JePLBzHj?VJjd7XeNg4Vuf5uoqf?+j--
z{UF~vYzSKIzYMZ-_8;x7;naxhTDXA)1>Fv;#Y}g=OSP8J;whdyt)kI>eETw#y-Ha3
zc3JOL-sHg|f57>`_TZDnGG$H2J@beA-67#~$M!qZ#ITX{Q(f-ejoK?6+Rl|uON5Uq
zR;1na8!O<SzkY%c$~^q{J41X_RZbFK_7VaJh9Z(9-RI+NevChyUF%mppPJbD2WCEt
zbFL9C)OG|tUL9phJK^6LlqG!3OL*6skyq4IQj(n(hswo}o&5?IxPbZWJT({WGT*cH
z>7)dY)#o~CgjOSE14hN$$3?!Z`U^!m7Cb(-&+~lIQ>dXTsAk>Z7n=Lx`DF%u<9$8c
z0NY;LTZH7ypz^~*QXsz{9g^E_@BB?|UXaC8+irnBHlF5}gQGZ(g5h=IfY%Mlr}{~c
z?Y{HHIL;@#yFTYW!_LNr<(1XM7@rR!;GWW)cU{rRTvB$Pjh%ECb%nT^re|6n4Ef$)
zj7?#QgeWH)uOdWrwfnQZj$=**2K|VbO!3bW7w9XYOQj}@cJcXD;^Yqw9wu4xI-D!<
z1+yKc@c0;;nPKB13d&Sn%B21vC(d<@6q-TqVab>6Z;YJx(y|<5H8#L!uW&SVT5QO3
z-7c9$2NtT4AoeB^ayEGCGOF}}BxWibRm|N}*m{;0-bQjsin`Mc^$tEOA9cp3gTP76
z=SbCfX5XFWBdhKfE$QGNRJ#vcHd+Y1w=M;L0gr^4h@h!N%N$O34uzw_Ke0R)UL`eG
zMXlDyIG&wOe5}n~N!$2o=ePC7DygTi748nEA4SUZvRNjBT*A)&aGXf7-IoS6iAR%t
z2BU|JNOk8})PUs1f!1JC$I#I4tR*Lg*FCwvz*TL2!g`}nS`r=q!6Rywu=bPC_(^lw
zHMN+$SS^LTxYOder;d#9;>l9BM_?iwpm!}T&*-!5Sljp$G|D9dA7V5dDw2s>d<a@|
zc=4N!<%Sy}e<Ct>GBm*})JoQbT2aWNc+2PEm_`#Dh3a3w9{HTjn$t$uEcs}zlo@Bd
z@>WZ&@wN=%JohW-JHjc}QAW|TLnU674ypA7;wR0AX#~vk$N_zq<(ACm0B<BHpi}4e
zo>^Fzlapzrwe9eci2k=W51(b`h*m>**olvypB{hw#KV)4D5cZoZjFu4otf)dY^VE1
zB!Z5bGoSzQ)@<JP@;<2JSKskSwr$K^ok)F!#(MWnpno?AbQCs!O_7z+1m_U}w;nHE
z(dB=G?_V$`M#+D6h`PW=#syCEr#)?Q&5?-+TJo0cOGc^*rCfbTh;7Z(j@PFXdWK9e
z#F>H{qXi_SCd=cyTl>Wko_MrZ-kz7A2MrN9%3nj)n_^dn-=#W@zph_hRoSY{HzA>e
z7%v~tpy>Qie=kseVd`otdFS%<mjr=o>Rv+%UQ)?t$}-WQ*aU~uvDi0(iD1Xh`$PvQ
zf`nE&a#HBxg?y!XBR!!rFkX9sm(E17&inb?6=Jj}7-s1Gq(YqGq6swOnC8f7go2q(
zWNM;uVr5Vj@MU<UQcWhFeJ%GEWzBlTc<t#REN3Ik`+8aBN#u0@*hgYZ>wbKCSvL%J
z2XE3A18@pzx<p$R)a!hjX-2IYe{5nk_0MUVoWa=?=vZ{Rdwk@4>Jq&lJl<wKt*EG!
z0Bn;+N_=D$3T10;a$n6T^9_g^58AuYr<4#K8>btPxYs;A70K~Kl!!n&{&ssi7JvvZ
zOhR#Tu;@W|PsiiW#-J-;KJN|_Bw7FA;66U~f)VJ@+2*jrLZ}~Sn)D^|?Cxn<!G4Fd
zr{-62Xm$~=N%d7PLfJr*9!w21B~)}lYt^Fr$46n&j=**V21Kegl*<QWp?qIna#E4t
z;LqYK)T_f!`&-la_!cF&vzqg7{J|j^^FxI?g|CuDCwY>A7EET24<{G*TGp`_!#Hl?
zCA6nT1f}NacuVl4(0%*nhFv1fTjP-Z$G`On51*deVB+0YA+t?7As$C5>eIU|y8ux`
zY&pK<2pDE3MbRT_hVLgv^+aaDp&!imlC*O15=;HxZ48Y+h3a`<5#yf8tu)=gm8Rv*
zdC?aJt*pG7$mwVizUMUqv)^t->Dr*-i@kEfpZj|KjQ+JI>GUg%<#yl6ExU^6#$bOh
zpx?5Gx5)HOuqX-hqt>(3mn)Ec&gI~;@6peDkFKDXpLa#{aQv2Rw26VAg{$+5K035)
zw28WND6qNoJR;@`$LEqo@+}WBjv(A5B3Y-ssZI=lW@Z{YD?h!Z$F&T${rM||YNe^E
z(V)>D6C2STg#Z?vi^0dL3{PKA|LfBo9nXEpy3^8v-gPWeSS`#LWn~eXB&M_v=?f1=
zkQ#soe}F)oc}3tF*heibT20Ggx4eqhOd3CW?bz0Ew#+`v51QQEKGoGW7#i@r@!B9G
zS_~w-AC%BI+|3euzO8Kqc0w~%k6P8e29kbnMUhEcjQ4nsOAJ5xIr?RWA1;=T9{LSZ
z6!&GKuHJmk(>H-zs(j+F7@4(%ydH1tZ6>e;1G96qLiKUBxdkyl4o;FzJjb?No0}xm
z5(aVmO&>J+xUr{`a&_TE!rEU8C9*|x_)X1)={tiwhLhspR3_2#bEfgM6@|X(K8AM;
ziweQ{B=Q9b#eaOh!)JNu2m%O7%9&DYKCTY2E-&eW=>r2EclJ?=*w=h~e09Rb-_6ws
z2|rBVm%)F_R)B8^-5$>fqnmx-w0kht4z8_F?Dh!h>78Iyp~R2Rj5_HIIfs!ZE9a<A
z%~V;9V9UN5Vx#5NkAH{0(^t#4N0+vKlu-7NL~35fiVxUE8tyqs*ZKNLbjWFc8*qJ1
zz971wXkGIfXb%6?^wGt&B|>ZG2f-?ty6RH53vUFGX-V);x%O<%(~%$1Q=VdM2&NA=
znJJ)$9FkCKD}%$PsFu|Md?YM&(fkk47ztN)bcE_wC<V*LDd8~mMD5%%Y5kz_?a-eI
zg`C#h!tGnYwN_Q`<j*bNuztl~%BXJ)U?Dof0P(4Qd`o(C?PxANX=@8O58r_5t&Dhi
zaDY7tygO0Lx^J+9QVCR+?qmZc#i7Jeu=u?~vOk-<Pcn|?gr~@I>EAQmSGc0YdDQdz
zMNeNXtH2cO($L)W3(d8bt}0~1{IvOaXHej5etO>Y;>EY;{JF}n%P=ri%Xgsz9hWs>
zDVQ9EDVfI$w=J7`V)P)-Mfl-PTvRD*?yg29QrrM!Az<T={U!Igh%)GL4_lLQbVH1P
z(goM+aYmVJy2~2Cl^R&2N4NVuLt_z&^I|eezu}pA$*;!?H6jdUhw$hXb9l$hV#tXk
za@6>*Vq7&k@Y(T?p<I`4#;<(eLIVQX8S1^iL|#GTIM4Tzet;$N=>_kbWYTwI`|jQ3
zM7#Z(5UhIk!S+@;Rk?M#lcR&xWsM;hQHYNt^xiglC&$ecaW=?V0tPY6@x;)X)(Dfs
zni$fJGLs&4K#SnN7MJe94^}so##BKqC1+z)OV)Q*=tlFBoD2DeU+&*^gY>o0bT7iu
zYBhVeRX>a1&L6C%Xan+(<2p5HLtqc}6`r|vA6-+n(Y0&djzb9}i3ia^Q$Sy!mnIVK
zatizcZrBqVgdzjWnXpPdLue5AV;0dBi5Pdwt@L1VOEWWp(jU;3@KuSQF0Z%hesxb`
zG(}qb5UPyMGW;y>Ex`wcU;~L?f1)qi$i?nyOmaAl;5uKC{&GG%!ooaU<>JvW-X6F1
z=&YR;8sK{C`)mKsI4R`0;i$w=b%<RFfCBYin8i?(<T3@ap+}a4C-nBCCVH4#ypjaa
zf}WK$&GAav>bWeo?sjhv+w%9$Q588z9rA;<*0GiXdZ;7cxH*l7(5I#^zf1PbMYEE|
za{g(;2i+E<2K`8`XxiRA{cwNFj85dU!G4FF4F^|MTKT>y)MPDFpLCcS4#8f1=b>Bp
z@kevk)7@Us1Brh#r6%t-(c&4yR<q4+M!x2Ec-i*sxI3D_O@E+&kmIVE2d(3X7&wB0
zOxoTo20j)6i;^U56D03%0hF*B&J(JF$3oP<z({J!ewg9e!^&Y%?x&buOnQRP1C)x4
znti?ebxm+8z2zCrkD<)x;<_3@w9w~CY2sw`Qf$s{YZ87)>TR@18)^$@a3UW_%~_Jn
zN~Al2DoRCCQm!n*Msh~lt5h{%I%oB?Xx-2kjswg>dpch7SYX3dSqC3kg{i?-BPJ^(
zdE8@OQu=6`MoY=LaUNRhV+Uqwsh#yu<9-jiT4T47Vha>g3$~OZm*GLSZrv{1Al?Y?
zXRk&hYjkfi0MN<h>XSy{ugYbm?rSi{R^dS94wq{AC_$TpwIl`WJQ*iU-e4OmZe$-#
ziRzM5yf@p(n|HQ={pDRf+$SKz6eEUTJyc$kf*{puW&~en{VOmY|JK!%BLp`o8^a$t
z$Ayw`3+;qu05!|C?^_NYC!b12B9u7=`}y6LOprL~Qs+5CNA9Qgb`~}eDrW^k(6<QP
zWTs(PHDxB2UTf#-8t6+(1N?F&qi5xMVFUiONHa=&ZA-KK@_;&kj84vGsQey5mh6(3
z{Xm^gsbj|#g(6>;R!HII+UlnBdy>IiAk(KKnJ~J6{im3EG)4z@XhJ6K+>(Lq9?dxa
z4EJ!__v@hYIA}V5gy?v-ZqN$uD+OKoxx<fg6t$0`e0_V$q1f@5KSF}>Yho-_3TuSe
z7(<Yvoij-WD^YCjkS!&Q`;$A}UkZ}nlVlNhzh<h2mvSDY&BG~~h1@>GltP+Aq)d=8
ze%v*@I$XA-ot#K>+CGbbk;XtrITDS~Mb1PAR=D0}RrMbz2z@(}Df9WjRv3eTzM~)h
zEwgm9(F+kl7Z3Oxh{Z^*3KtE{Vp*LVY!rdVuN`3a0SAPj!7$0jHWHIf`AV~Z2+)6!
zm&E+&bTp_>3xdBJM9X|gj1OkGo*oP$_x?`gW%ha>V#Hxw>%f77w~ez>2a28+M(^9u
zwu!(ot?0mwQZgbF=K*M4^j?9SxIuOJq@+!GmI8_R-y2{sszr3M3w$;HBE%*!`MMB!
zUlX2zMrtD#Ce89_$_2j%LmD4Sfc`v5exKw7m4mQ?PM|vbaqs;2tU!fg$rt1m>uG`P
zYV6DUI%$kDuS@Tj|C1GdvLs^g`bZJ4**?~@@Y0>V!5pE~GkZLpF1;@*s^7cC0`5y7
z+Qq%kP`sfmD!6R?_~9@U&v%Kncj|oO{mGGC)4j*LZ_AmD(y(>+7T4m{+XIh`Coc5n
zg^ZEV0lDwDIx<9hd(Q#Jf;ovQp76c_;qnQAmBcjiYBGq#ihG;u$x)xk#@U>5&W*St
zX(ar0Hdq-~^Zh$%Uy(l<h%9{FIjw<i6)?Le&^GX5?sQ9}L)%eGzOC<8slO8sIDZad
zJ6TMe^rQLm1RZBY-gT&jyBMSwuA{J;N8w4kiXzE=MOF}G|9N6vR0X^)b+<k!ar5M6
zUO$2C?{l#;Y<k4SXv}AFfpPkE(8@~&R!9*4{l)`!YhjQWpU~PdA!1ZAoi`%F*Kgp7
zq=(_p;y(Kz#E^)$)h;IPANlPl``$c#W4XZqK1nzGyxS-9U&1{;$H+Iff&UI|-=ele
z;-z4k6z;On30@M_deFZmdllY$R-i@t;vDqC&U^;e59oQuP|Dg8<MtC|8T_EZgxxy{
z{qe}u(c#N(RCQl30A9sXlh(NU5F{GU7>rmHinpF%^fX>5zDBy0!(E)j)$kn#<@>$B
zw>l;wlDr={Ra|07J?W6OlzN5g6?1M}K}N*3Ykz2RWiqn_G1h?rt)BCH=v^*iN_XKY
ziB6(V9cgY|Uz*xDu;d;Ltaf5_L>AE4EGKoXBY?mhaz8u?TtzV#>YfdfOrH^oS0Y6w
zcv`OB;NV3V0g+Ov+x(?=)6s5UV0v;~G~7W`lbd4E+{}ztx>ln`){3DLkuF_g3i2B>
zu1G0s^mpZ;fN60#`8bAiV&Y6V`A|!bqiUYrApup_z))oV&!%E){i}%@8m-vqc<#%O
z4S3!PbTSB5DXMa60!j*En;@tWY%<|^HNI}X5Sis<P{>%yv2rOD#OG(Dhf(Nx@@W{m
zMnM82{v*U|Jg^=aG#?xuHpEpT$w1NSQb3Or^Mwf~>|fsQ=wNz?uevu~Kl4EPk8_#=
z;`vRMl~85><8IF4fH;#C+dM0r{<w#!-ax#?F<h|!zmRzrCY>;Wt4y2Mp2J?&YsY7j
z5$0s5W2tX&Ngaw8<99cCbNJKqggan`Ns3=oRV9_7Xjf~!`m^jrDzWxE9fAD5Ie?=$
zNL=XqOh~_ZTsl%6jSp(23q&`1S#Qg*bC<AQl;5nGDh<;{uu1gd>1HiTMva?|utrc+
zFojtg28lM3$H2+7^r`T&eBH6ag^|E3nLnQ35v=@dr*tCc(C-9|3H*dv3RLvTK-!qK
zGFh~5?OisR{m#_ZF6fkq(TQ@$jJ<;^EMyi_<rtmT#JaxTeKIg^ja>WgYr)U8{ML5^
zao)Op6a&o#llRpjDQmof(^ibPcZxUL6+{rdabOYq%ku33lwRm)m`Gvqfbi;ku?(E!
zB>^q8PPNZ9%U|eU#p$ll+LSg$m}}rjlqkB^9^roUvUSdlrky7&?PAA>Yll@*Y}U2T
zI^r7Y|G9|FqQO--j3xmJQIR0!MM4PJ+sB>%vK_Vo>OnumG+`QJRpEeggb~JU3eJP)
zo~rSV#XuQQFJ0+}{es#p&TLXvQJ2CM*r$EuMFu8gFg@rF*O7pZOzDhN<*Rps;iP}9
zt$*L6iZ>%Gu-(^=I$A7SCgl4b)>Ay89$I0-12#t40j{T<1_Kjlx3L!#Cs6<VYPML+
zXSQ4Ioq|V%1WTP@ZtIFH9&Wj0WINS1>7bi$hBxZbK68>tdh0^p8O;u9e+v&hO+_wo
zgO(LVH5w9v={tsEX<}Wd==#iX9fbT(j6^uxQrw<60_lpwYG)a!@7v@G!?n2sn>@MI
z>0*K{7YId3jjxfj3Y_FH^jBMLN#er8cB(xP<%o3=Y(B`4fBn$7`6jm3#pGK;z&T3m
zqhc>qT&UzVMo%CiO^gomLo~X6!$<8uT5qBb*2yXVtOJpK8Ck>U-|>|0Ux>*dQ(s4U
zZi>HyOJw|zu#ar5T)Ehvb)=XCS)rx#rJ9s~&{8QOL4%(k!jUEaUXFjrFmPtR%^6}+
zsxuofq9ibPGPN3E<1nw2#d=Trin!W;)S^9Cz}E3(ru!RG-1^VAX)ZPwG^&QdRun`Z
zq`|s;<!m&Y!m}G!X8~+>SJAj5ZLmfMu2v2+Wh<8ME?+K)8XatoQwwoUfh_NuFY^Iq
zPOs;DttQ;l1f4Vp@DsS{eu+kHY`8sl8we_(Wq^k?s6%2LgLH8<8hvCJ1%JFnYq?vS
z8U^-57t3oWyaOWp`Hct9cz@!=MP-QfAf3}?oBOz4;s>jkv&w4wV*_;eV=<{|dBcG?
zm<=7T@t*nui(vg;p=+Yi@S5jZ^~{_g4iZJN(678hj4D;*V;XaCWXgqg4kT3Ag(7!u
z{)OLD>R`WbXAfrbVNq9B9mpE8;BYvOO*juT@C7<INcK(*?2;%l@zrv$y&maV$_ZjD
zqT*q>5z}%+T2EU!K*|~#wLhqw8&qyjy;9J58Cr!YrSSJX-xh3ph%WZ^I5IRIOzfpt
z8>35Hb@N2Vx5`}ACPgviVt>I0y#nU&c3tiEYrPFx^WAc|Z|O=reoKkf2Y1gSioxhE
z*p*ZhfntFu8m!hK$0yr-_aVt;vY&(Ar?Kbx#irxq8-x1~BTSqMwU2Jc{KkX8BK^Q$
z)7wY{{h22A9~Li<j#q>cFxLoi?!*}<e)zbhq9{9c+<ndrm<i`GF2gfMb~}mToE@%o
zKWmR@ZoROG+N^w4o7*$qDbw`$y|-3M&2p)*uOyR`7t|H%AzyiNC+H=TRp078`6~L^
zWH*1-bK3{%R?yS65p{&6^X_sx>Tcf!Nq)tZ(oaUcr(w>>{3%bMsNA#`rUOA}*9<G&
z$p2h(_`}iXoW!}nr%+=QmxELzkA2O94_<3nxsK4645{b~!z=6pKWhNHPM#Nb#qRef
zyT}<*cEkZRINGJAFpD9D?gu})^RLy$d7v7yb0*4Of^~UtS;BhP;Cp94oOqmp(qRmE
z-Rl+hFB`lZv8+*TQd=h9YIu!QzxPwIj#OQ;T06<oKUV2%cv#!N&?WsaFVY5KQ3Vh!
zCD}I(Om|soIqoMMiMFiz4}nJE0|ZC8UqhXJ5X%1wqRO^0qW4~AgB|Gg6M1@Y-(Sxj
zsa`wsqvdfQ$#3QNdVezEwbpsB$oflKXsJecuoyc((S;B@rwQ(oH4L<~lSx}AvYKZ4
z^Mkc@B{@Wwjg~nvE|Wh%4JO{P!DI03V8?Zu7N!&BwJx@n5W}aBJsrcdJjHSA7C$j}
zcpx3pusYB9kwSX)$_J{Y!12rZ>v_?isDvoi-W@Kjb!*GMJ107b1_s%04fUUOA3Rm%
zTQNoE0)-{{B{P~Lru&-L^|J+A7b79@D3|(+_VhNe*SHZC<_T^9%M*e-XH|X(tL7Z`
z>gXcI=2BVFsks3~q{m)Ni}$30hQKM%bw7Zua18{BsE|K~VXjhc+{GLR22Ui{d&7r6
z)>SsY+H%lkwcy|^H=b-^<9>eALK)V(-rRE0t%^pcIkz-XLHQcG1+)sE7;kX0H90pl
z?ENOEj$#E~LNIs9GiZH72ZMO*M(<P?twVMjdc$-1$ITCn6a`l=o$;s0N`{ewq}`=e
zjC;v>ewN4)Ru92z=~MfKsRxS#>xc|*a?7v8OFUF`gWm~<ozyG^W{iE_R2}|&xLy6^
zeup#kXxcK~M#%Ijzq6&m4P>D9R)eGK3XhUfw7$uuCPN2D$I9c}4|ykcyh{b1&)f0%
z4v>HE^sI3)j3th#!rM+z4ms5gC!WJ*c@AXmu2OrVGk@&GWQI$a6USfCf(!D|ymeXv
zZ%_5J6=bmnL7m>7BXuc#+l<Oh>w$-}ekHtP7FKE`l%_hZd5vXh6I5TJ*`EihFer+u
zUZyQ)+wi9ihVF5o$PyQ4yjFb8AI7qEPM=~GqA!@|^Ltv+r#p`fMF+=gn|nH(CP3xq
znf4Q#sCfG%Vft=uj}ItC7!BnNsF^;z=H;+3fR#ft(pCSf{mo$}e8UCFSC2X>U!9r@
zRqIu)=wRRPTz8y|8o5!S3l>;st^wUnPHeUh&9LG-@TP+Fe7?ghEf@AtQ)|6Fi}4@@
zuAazFMSXmpy{fvD(9WymO{ROqyg)M?TN-``;s|fpT51gFX^ePCmQ6Bc%QYBYsDGMc
z)UQ<%XDd${hBGNTO~`rKZVMSq72Q$ijNgju#89Hp{&}HiqvJ!Ymm_$Mc1K$6-Qs@J
zpcP4M^TV_*j^MCS!MO)vI&{|4(nU8%5J36*JDUaUkkrK5vMzyqRpWf_eu62Ihh_D|
zS$!|MSz2R4P=Q8^6VwE`c2c)3d2K*mbpSYs+8*U7^Q@2hxfCbQJk3z3*zK(%^B248
zDg2iMh|a?9rT?w5@`rTf3yC$9NCa2v$zJlDCCi}jhk{SBzdj!b=_~M3!9Dn=?|y$z
zLb>dl@Ga0eC$EIi0}h4pke&G@P_*ZEbSEo0DE*_S|5^_g{YN0u$0+sy`JM`~-IG?7
zki>8G;4SBR1=7cel|ghY;I)pv4jcmGHajaI0@gbPBzlAT^i9NvT_=G)qpPPb1m_E5
ze9~Z(k-eo8n&Yckm(S<RgraELv4esRUo#s0re}vrP(Km0=yGr0cOE-9ZjU}CIYe+H
z_AuBXhoHQ7WPQ+%US2$nxfVg|4beh5b2#SLE(Ac15;v~~VDC$Wu6XHm)F1(e{aMs-
z98p6)-dw3+i?w^3c_LC00GDT#u@h=`Y;Eev=R$suG|!*5bM|JulrgQ&`ehvMeV4??
zwW?AtpIDt-2VORZ@yW9Y-I^xalj8=pD(RW!g(WdhdoT}dFCspl^UN~m^D~b23>s~y
zp|3=K_xbYGF2?i69ERu2^LWzw#|lJpDAs_pRF_s~7|1VH3Z7u#lWH9;@*R@dZuf<)
z4I#qjy1qZx#(n3vi2f$O<>AUpQoE;;q9$G{XIoDotm~V#lzy3~#UN55=N@fBP7dT?
zw&DTV=&L^USA6x~0YPssJ@tOTwPu(%fJ-hR(?0^IqCD=Sc^QIUfVOJN{fX(v1f6^n
z`zWaO3v=+p*1F?9J5d~eD?={`jTg7WMdX9v!E0bm1QN1ZV5f-VNnlQ7(A>B6tU?0-
z&*F!6`LSs{Aqx#uOVyO&B{Q3eEUupnv#hsTHiRD^XYaPs9P5)2pC^5Jjo$emX9xO(
znN=X*P3aQ(Uat*QA{}3wfc&x)Lk0}gGqSUSVABdG8RiTF@$U_aWnRtEo#BDaZ1EB`
zBEx$=;1|dAlj?HL=x$PLEdu9^>hs6|R*wEeOFhj?x*Mfe^H{7%2v=h=AaP;RliKDd
z)w~D^EKBG+a%bWrB7FB>sJ<D@ybqfxL!*MXLQ_ljujX|5bl>%UC(UU?8bOq=a%(Wd
zzQ8L*sXps|<>d5M2!1SR<^D!#X!hkJ><GI{P{RX~0SyjO)MjYL!S(xmT|uP%uqy(!
zd`j$3d+rrTbgNVIsI1kmF;2qRw>4?&I#cfy>bmg?<sfHEIP>fNU}Ve_9z=yRb(D!s
zOpR58MX}cQW;5Aa|AjQBF~`+o3LfJcW9hK7fKVgTum;ALHacWrF@Qjr&Lc5m6j=ec
zpu<F3jHOP4PRv%T`HduZ=B82*z7HKtvEfsG&%A^#J4_AUz^mH1V0ct~d*G6vN?!}6
zu3MZHNcYigAoAja|23yFOMN}C;%aTcE~=t?D6iR+fTNw-O8u-5a$~-Ry^Jh74TK^j
zbifY?Gfo^^>QjM|A6ooUM=ni<I$k;(^a+}K(@8C0Vi2vIpB^@Cw<P{*@{#1U9w`-J
zI!^b|mHbJDr+7T5BoeZvL@LRFpbEJ5JM}t?XXuF>-rP8n)LfWr^x^|KpKb?@oI1}j
zwRg~7<)LQBaTiWXot-Xq)-=5RCZ;a-nQPRQ&Bs%C&Pn)TuJ5xuBJrGj&)T-S6>&vG
z85%W<dlS-|EK%o9`02yeIeRwU@bjWir2x|fS1O{WdJs?i_@S`<2)MSUH$4_t6jj_d
zg@UzQ+h<YUbk^EZ$<=?29RHY8!ThFwg7k;k;!N$s32q*19gD*@KSLQ)ZQ3c8NshM1
zxy_W!cT`rP$B{Z&P`R%`Ra22(U~n?hT~vc1>{R&B2SN+yPWGZwQ^fK27=1nwmdFh1
zJblWb;V#IMLQWlmqphD!b%Rnasg+`?MY^S@>sX{UUNlB0m59YzU?XvQa14Am-1g;E
zxwsnig;?goVz|u5Rb={3rJ87%t}ArAC2_7R--{WetDIwNV%Zr{{cT2!Y}rjE6Upwr
z%`r@{d67s6HB4Oi+1P6*!?Alu#Sxq`LfrT*zbdEaiEdDjbVX3@;jVP{F|Tn=#=Hsp
zepro2FSURu7aC7|Q^ZzQ`8UxQIeMYSdyk|rBn82Hq1e+Q6owNL1tWr-rfk%TOXK|w
zYH)!gWva_${f*soYN~1erv|I!&cM$N`oqtc=FqPj-A9+Ietd9opo%a>{(|7|2b~R_
zbJ;!l(yJanF#(kQSu@pb_%kti*i!YZCsYI0D&bK#6LPqQd0M!YYLjO<WsaCXZ<pfG
zt$yA*GqTz_*VyZ3nu2A0pZI}&C!<N~HVYlT_~L_*e{6h7oXeTU)=E8FhW7SeFY-sq
z_d2^^4QL*vZD^Nw6&?Uqo$16nG#vtIu?bst*Wp8cE(=Bjc8hwRhAQuns&><u)Xof@
zFz&te@zNkK|7O`SfKS_6m4T0vFRLi-5s~hW7UPRI2k^Z@HLYdu+3KUN%hndQKS5&l
z+vo7OH~1%0ivsngA(@E_a(pgSS^|n<d<9048EEjBz;Zle5gTfv8KE5mUR7)G2DI(w
zq`{yq6Zg@lo;9<K7+XU$gtlL;UZ>u0gk3b1@Hs#S!WSFDvt+`p#MeZO!snlzS&QLO
zgS9vc7Pw0t$?zYRw%q1>pfq?y-@8HGdgrV-elJwq%E)kE;5S(DT^leb=ph#NWBnF6
ztioOffnOg>g5$*v>JBd3SX{6)wS2m#HNV@B$vkwRBGPQ;Lqf>VO&8|gj|!zH`fil=
zn69vxHF2Jvao3W{-mA{axOaoL=K3k=I)~ogHX0`_g0<R(?X6<Fc6`4ANL(lICPoGX
z772cC3s@gCkd4^-sCe~6sxM{QM0veG#Y;Z6*|9ABo#36(yRTL~2_o2W^CnmQ@13@}
z;TE=L_j+u#p<uR3)~en%?%~It9Uv+<+E5X3Z55l-Azd4h;{cUPU1rjHp?m4`yiKl%
zN^KixGfW)_(VFg%(^!o^l2&#(C<SKr>wim$t`+qs;48UQhS>_JpFMc}ZkBiVkXJwL
zLS>r+Sc9zCse{V$x0@q8>@PP5NF0^ux#mG+2h#7Gu^8j(ffYVjsJdR%hNLYNlwKP`
zI;7@%+lAxShBtB`WAv}L*HAtUao9Y8JorW%y}nv<Vh&%??@_Rel{#D4yF-5&ffyN#
zFo6kRYVagJ0bGz0iMuH_P{~c5F86{uaSea^b6{9eR<x9;(d#H2MKsBP*E<4$E%T#*
zw!?9z+{ppr*~muH2A#fAMisLh)Lem(-ZgZ9Z?A&z#D=4uYJTXJQ2h?6KGx>ef<C`s
z!y-Q(o*z^|kn6Ad=o^7sp;%@yp<~J|H#CM!83B>djea?-UOlD(8M%dTIFl}Wa^I5Y
z8~7;^4LWZKfqk2#<?v}}%Gk?<H^A#yL{H)kQ#@CmV?sdBO)WiK&~^qbeJ=c9(g?`_
zeDm!EF6o$A+5FE?jj50d159yP<SQe~`syUI&djse*x%;7j~pMDv~-Vg@1Q{*D1-_d
zbDL$ciTtP}lHb*p(0${<Cs!k)&UB(AC@GKKb%4@HZy~&QU<&Tx&cqn?$TCr5&cIRP
zyeB~V$M(5nS2sJOkM}k52k_yfQxJ%P=qa{SIFULap1IxijA_#>szfb?^bOb~>7Dr&
z%}-(yYyn;Y4{fV+EjrQ#neqk-+r2vY^hkO-SS%P;MgE0&ln=0TgBw-mnn6Bs{n^y>
z_1pYB`n@fgx3TyLm0)B4HE=pe0Y<`lm9edX_nDZ8Bu>K`ax>m@Tz^gIw&m|~&Bo(k
z7%?KYOR~@zEF7PZ5V!TFz7vNhxm%fJ;XO=;A^nW<vVzd%lC&CWz9IBLB!*-G8T~;g
zkvqFDD;Ng{Vr~F`f8dDhj2zpAcMh-<2d-zu_*+NAr+AWScw#_`$XywObN#IjhukbI
zr`_!fF)kBv;{!W=M;z)zvyo`J8;gslLp(-k`CSjxiBkR4%D!QFFoc#y6Kh5pZ$oQJ
zmVAWK_t{sL3p1*e5TPL%ApJi`7J`sy2TZMchL(~#t1gYX3p^AwUVY_@huJ+bD~_(|
zRAq2D_+W5`r`#Kw&mLp~R9>-EDd-NdL%_r(2Y69A>~ew?m*)9o6=~AMhq~7?7e-J9
zC(RKGpUzR9as|Y*%~it8tA_gXR#}lcB+YMrRW5DfbsXBSsjiVr@KzcyDVHLaIFeaH
z#=+=+9tYpN5{iQ6o;s=(zH^j;`0CWd>LBeQZX(=?_O_xW7HdZkd%bR2^tpf+QXl-9
z5B=KcVoXASFWh*RAep1bNYWzZ;!*X=ovZ0F<WAm4v+`1Hp1fz>vI*|z$5_~EGYzxm
z=lR*4?Zvm3A=O7*?nUn&mKlJ}gWta*ue_hPCeCT<5<9Y-R0FK9d(?m0tba}yE`%@Z
zIp5OD7W`!Bw0jiU4E3@^Bg_`ToHhIn+Kv!;U*i-G{rrzoe;<8h)2};buG!}e!IL~?
z1M<~Vq%zLwnrr4s@1+5`;=}o^@Vqo|3v@b-f&E8-L?;jdauil3n2pvUFkS+^KAXnt
zVw@?_(Br%N@>urcuf<kX)p|oNKMsbM+TxW@n{ZIMs^-oyr@;q7S(>5pgY9iFvn<vQ
zeW7Rz$t)I+@kPg`(r!(tAbQ`0Pnu7r4zo>`HiFMX77oLy_l)^s;@lNCu}gkPb>)!d
znd~yDs(m<#=Bdf&@m;Q0puVS`c_SfL)O3^-UtqUz&Ugz^CRepC8M@iB58QAjl<^t9
zO1|N!sInB>`ZE~|{I>2H#^w~QfCVnJiQ{0<)^N&eT+)q6bS4K270nmtV45yWQfFow
z)lWh)sEFCzwX?gbNA*sch2skjDXUvJgZ_P1jv=v;I0Xy0I9BA_y$iRl4dnMtN9(Sy
z#}~>~AjZXsEouKZM!1%8XgHkWwW<NksvrciuM}I<V6wAM?13M7v)8JY735_iB#KEU
zM3IhUHxc;0VW1GY9$?NO68#)lqP>-AGS!A7&9cZ`?Nd1MIKZ1!t2{hVS?!A^I^@qk
zY@Z(nktpDu8%DlaF&|=daS&E!?PUm$)JmB8pv4YY>x~(41+0DlZmE0wHi_3A#jhFb
zMT~p2(gcdW>lf7JH}!c6d@H%vXXAs5jeMx%OQ0BGRAq7&U^v8mH%q%$@`G6v6q5U*
zXn6jyqtpYXi!Qw8)s@lvFeqQh^6&Xb8h8rn3WL$~Ugz&!0O*W`+}^y)d4Ac{<WiNQ
z<JR$X>D-gBh*geqw9l}^VebzPy&PI#`;dzpxwUDMKYJX_@qDL<T!ML(DmWECCN%*Q
zUL3DeSo%p_E4ww{A*Gb-`~uDT4Y`_9#w>3<EfNA0Kcf(bua}AKwb6$9UN<!K3`50E
zu#OA3;DiyUW-ks~cMQt>JBFX<%-mxD2|X~my5{NTm7KB+SeZ(lh1}a9_oBvXQ^H5e
z(FUa8BSlSSw>bluO&hQtx#}2SiPFjb{h-1G1c_3yfd@(|G5&s6k&Fz9QWZ~OY6AcG
z(rFYSQ7TA&edX&vXcg#?hZzja;@f0@yX61hl0i2F)77ycy2rhj_k?2@oIHao&lHQ<
z&rmeFQcCNK^WE>4ivHfGjTn0{MFuWNOkBGuhdE48HG~e=A<mONiK%tb)#n4E1hu5B
zB+M>@Mh6B!6>{>d=A(CaJ9@d%NXFl9*r8h5vZXSleA9G_`Rldzl;N$ELE^d_$Tf>Z
z0`>KPCi$_S=L{aSH5**Gx*id|idH0>OY`Z{;Bp0zJ*I3$4-bar(cA{`L(b6X8^ebj
z{56O#w$UQ$Zq@<Q+ufvUGVj%Bc6eBQH;!H-zlVt_lwHP$p)Cj>y&hYpdh)do+@2Y|
zl<&E;p^GkM3{{It8Jcmn1}56W<rM3dMVZVn)~Cx?%Tes8A{e+3nvqwB&LCze;&+2W
z?i>jO+~oXbxojb$h?8Pw(hM+aq00uk4rx?#F9mKD6XemwC*0a*@^Uo|oaMxGjqd`>
zN9A#0I`MLQL|0Aq%wh@H2Md~+G!xowf&}>7kZBdd*it&=Z34BwpPX*HrFEh#K&BpT
z7QMB<$P~xGc`=gaH8>{sU9egev8c803!DStWG>tJN;n*gg%dUVVLHl&!D0fv_aYYW
zgwHvs8ETAv@r~4R`k}onDV7x>Na$qr3m27Q#=8_3)fg##6-?j~CKlD#ieUuy@Gvko
zkc)Y=41bbH*}zCcr-3yvge<`^ShB#*WR+3-Q~frtSfbtMWX`7fEHt}pj%~Jl&!?x+
zNFsRy1AQHH1D}Qy97Z*^Gz#M7NNA%p3;XefCet-+bK5LvVI>whKASgk0r;4}gS%+&
z`CmW7WI;Uz$Oy}8Zto1Glu~L+;(W$f9fogx(6mvRT(EfF=4p&r0Ik@g2;)welbS2f
z-5cZWn1W{>&pip|{LJBScO*-+c_J>d@b#T(mZAuXRR>EuslWxaL6|^a=o#8}`XPjr
za0x6rqWdp&{cw;cGmkWlm67z+uO-E-AunG7urELJn^(CbW2=S2%JRw9tHsyKZXzK_
zFump$SixjvGr|lUm5sqmjiq&k-g{H*DEl?RgN_6Vfw({o8x9%*sm_P3N;p`;I6a=X
zZ$)HTqAs5V5I}2B{xvK`jTsDp=#q?Qi%Jsb_hTCSi3@9Ke$JYNreB&TrIf)=VdK*t
zcN*i6=Tl%Z0W+*IF$b{8iaj6hk@DNto7&;hkEB@jCO*l-`ZQbg)(2Br#BHN*Q|!KY
zdH3P@QEJkNFw;2QpYdh1eAgI;W%KV@mL14?mJJJsK|-JxjlpEffeH_cfUQ!Jno0&3
z5kigP`_WM4Ey~%;a)-}3gqf1#ms;7<lw^AVFo9#mg>V(6J-^cqL%--~(1hwlV_~I?
z<qn&Um#=&*qDPT=rw|Mfskkv|_v7fa$tZ`_>n)HX1DmL>NM~h-L_qMQ7i7|7<MEJq
zG|#NyvDsaz6%7c|jQW4ha^Nf=%F;8v%MyV)+Kvdzbisz^q4hGMC`gjG@MfKsVeNdK
z>XK}f!(|!sK^yX><wv?BtHau!+(M~dcV1;c7ItJ?)#qdpMGu4>dPrZ>Ad&nE49JKz
z;o9bJvp+SNk2M-r%>4;5Qb|EJK{;*&oX9^Be_KpQ#Gh+9!%pf?#9#e)#9z~0)%4#H
zf12MBe+U`v{~Z~&`w6qb7WW)cCbr=bo^M~RCdNWv994!{YS_n`?PB#X)=CSM-yur`
z`_{1$5z0lJ@jyp@C8Rc4!A%syt71;mm-byENn{;nt$J6PgU3Qx!?-$`3INYy;=^U4
zLmhN};(>=4vvn0TP7sVa5igspa!b6lOGdCR4};CzMzD#F{q>aQ@~Fub#aDO<B?2U6
z2&WC%J0wga5mYyO+3r?mq8+QxeP893I~P3Y@n(T8%~SOk*owkXpsIYd)eMf`Oqzjz
zm>|oz8CkYQDHWHYE(^g>=Gq<p<UP&Ev9l*=H42~a?xq)nLQ*}&K`(Vv57)^?x?9N%
zc2%jM`l)S_VWVe?qd(!f>%KA0TqIR=<LI3Ljc$~{rbZ@*S+K@v*NASUcK*R`bD+j0
zU1z?AFLiBcdHhq4`j(UP9e5%6Q|uCow}Mhr&#SkrAbZ)R^vrtL@*Ct44RUT!6(F32
zo7`jtIjStoa%$NS+OXzMYxU0mFmL{Hq8R&9c&G*j(jOSESPBg289ymU#NT&94W*S<
zoWv7x;NFe1lS+G@AxkFbTH<?SVN7;U4I=H-YgA9JSsqT^PQ<z%RSoG-EQpkR>Vcu*
znJQr`uQA!2B8rs9SB6+#&Rhiamy_W&215iRid}3L9uLAWjIR9mYSVv@MUy8Y#MV>d
zcHPqEQ@><vHe}pbqM`pb<uq4uVaLBK0SrJyHwxHOTPdX$>(tSF4%gBATKb{YH3;``
z+vaLc>{~PHa!_GJq_n_#?&{*lYcP6w3#L(sm^z1&7(|)nlfO;L-{hNJiht^O{b~_?
z(0hRMQx7w!F1<MqL3^+AzgG_<kt;ur<N7xbGpi2EqA)cr|J;l3NiFh~vfx(d4twn2
zGrRB@Xt`9tm62Lb1mtQtuZhKbLXX2qz*&@}5*(+cZUhH(J|x`XYfs3j;K=|VO8KBp
z<ho(ULNE$tD;1;8D*N8#A0XkkL=-t^O&8#@<gjiFb+C_*jhk(0F!Kr#ykn@y5;T+w
z*xs-8g&hCFr0tBBf9Z+%A3YuD-PwPmtrhwZvO`}{dGNBBamOB#!Oc}dq3BKh735N^
z`62YTh!t4>o<`kSJ$8f+mtxaC*4~x>Tgh%-1Ft-bI{vKW=wL}mVgh+eWP#bA$DwSN
zki>*6w?p;SKO2B-I3zIv(-x5d{*URTK?6xlpl@NBP585q{2!4CR%GG*+`EGJuPt2r
zc4rWl37@1`E8U7P>x^f)ls6<+12T;;e(O0$Vsi%tmx-;`S6YUT)9o(hmI5_SX(=+Y
zV8J9@htU9AR~@n{VwZ@1&!RDM*DVdcNrn$Mep5Uidwr114;ySLioXERe*@5bY*k|*
zvcXZh7q%r7@HPfjaSFsP{QL_5_OE%E*Lq$9-e`&Xz%Mn$b6eoyj%6gm%der|*O$TO
zYN_aplcqDG*&Rh1ypl>$|Mww-YpbWY@(b+B;B31|Z$3IkK*%^SmU!-NLXn$=cx!|C
zBOL^JoLVx+rE3^J3+jQkQ=F%9lt>0j`n-*AQoIx1(dB5Q{@A8EP^`r%<*CTsi@#`R
zFWw%GK|RGxfrhd<G1x(${#M1Yh@6{W0MHI4AOYo09mTIdsJX}?VijNV#)!sW4%8D)
zsPnawpalfQGW?YP1r@3T1w3Y5OT{6I$Lam^N*?|xJ|_6{IC*$;p)7#7C|z#YoJEgg
zyg9yQ({Z|!25i#q$f!LQZv+P52Y#b<lsL<uayTE(Zs*#WP_!}*6P9qPO)nrvJo5yy
ze?hGU?omaIUcD~uOR*(4x5)iwEBK+th3(i1r_O7jGcs%f&ONrZ_=)FM5!Qp3_v<7N
z<gu$y1mgGPR67P}-HDLutG6wM?}qZS=XypZ38v$(H65Hl;+NxM<T!{~iJ(GN_I4`h
zd-T?k$CQ!WSz5T*We22I&Q<6v$SHEK=}Iw)A7WJ;$r~B`7!wQ)RlQ8+C=r5WXr~Ow
zLok%RJi|^!<idi?U#_&sQad|&z<O~pryw_~5;!`T0b--<$yS~ulVaF(LC!dvE=Lt^
z9XYZbey!g0%CA!Sl425nfxLz<HIXdHMz3e{7e4&il)>HK{GKIpLa&8rqzc7>Dc6Ey
zOLZKv&Z%Z}0AysuKT426&&O8ic_DD~LB#338Uu{%Bxl{d6~tJ7e^d`UQffejMH!#?
zbL>^}Ouh*fQMzAVut@k#7u)|e?+pBat4skE8Od7D)))iK>wj-dQKHTQ57x5!RD*Vn
zSz|ezZvJlW>V}grRoBHs;n8F3p#8sOp&795-)51RdQf@LT9=k!lcl+!H{l@GMf#xL
zWFS|+&ZgG!9vow*csCY>|6j7uj47NzjIt8N?1FAt)5vmg^Fl_dZq6zzLR-h}5G$R%
z87^WD^XX(j6UmQF_%U1Uw}GEYMI>pd?87~1PZm)Gi2xWZdHZed*coxyMiSvRw5m)h
z+M~$G;Ut|Q&k}iO)eUE92HK5htZq)T94F)q-f&5KEB1Y25ywhno|CINqfuN)L~`g+
zbky5`(A`$?X#&|tdm^#%ZfDYF2RB1~E{8kfDo@c)mqJzaf$NLYSVT^kMgahr`F{Uj
z0JjxA;}hu}S;5UA@`bqd(=+q3@}ko;)sSlqT7Gy~`6yCdvk&CnVX_KurT&FE+oHFK
zr98zWR>lX;0VNk|L<RMbhb;|s!*0iW5c=BGvDCxPbSWICJq_Fd8Nv*H@GNfK9&(g{
zkvE@fTZ(dERdLK;>1d%Azthp=d?Mh+MP1kQNdo9x8)7_H`yPvK=cILQ1j?)~!tYk)
ztmOq{Aci-mfD#3!krEw!IEEp(yqvzW;$fm(tq^v=C#KG!UR4&En)d5vQ>a#gv7=#v
z&pxl*u;141*2o&okRHDVMfIqp7%3(Y8l<Tld&a=oR+qGgjBvfYfcI^qYn!bWfPW=#
zL5cxlG@AIGnzra!(wKyZfm?S&VTlP0*U^VI`?e&h!}q0zErRy%`>q)5|AUmX|C7u$
z4)^S)?9r)T3|2?npq@fptL9gfoY%2jrguG)J;Q^Fr6Uz-b34kYk2&?XO8MN3L>`6n
zKc#q&p}DZYlU&GyAn}N>HxZ&bmTz*LWxnVRT#d~88WJpS2Aq86=hJ(a_?G93*U)6F
zH$tY+@;jAa4PI1x;l|yzA>x*bSJf-JHXU~`?#E2Rnvt|B8L%|XPo{4b$2Q3=PbIB|
zS9bia$7HCqKHH7Dt1c|N!xwj9<u%x-sue%f4}>;6KeDV+nk*d!%EiIsjVFx<R<FWa
z9|FSPK@#Mu17jW~2U?y}PcI!ZI}?PlA9V*dcfw)v_pAkuUwNDqnhxDj;d~;i$cnzX
z&7Uc`<Kpt*CH>u@sFLiOu%?#Cgu-`hD4bQ0bhRdzB-0|@tYtpE2OE-A*f+!YoY{(z
zHHNM((#ij;owMv}>)rY_?(Pzbl;T!eytq5X9RdYfG`P07YjKKGq(E?Y_X36D9<+F%
zSkY(ozxRIjIOo;*04F1FGDdXezUNBj@0yqLB#blly?*J<N^m6VkPe!zBQz#)p?L*a
zr{M)#Us8z@k~Qz|FRf)jJg`3eSXchEJ@HAMf#S3Fh*D8WmE{na@YI@Q$gxFuM`@0G
z(W*%YZR^dHEb;Gnm<wc~{j5TqyK?mQ_Z+p&&#p^%`$?({dyed>rWQCvKV$jqqdljw
zJ*UYZ#F(XVtZ-z^XzCE@c%Y*+S1k-u+<|vnS;G3S)ww(Um_2DR(Z!PPS~KGz2_X)+
z>Qbk98JsKOn}J<94?`JkX5q~j`<nvZ^Vy52q$BS+W8MJVT8{ctXXcZuL&u=b42kJ?
zeSZ<p_$tfr#~!D5BxZw)XM(hN^k=Of3y<Rg_J+Hnb%?L-Yr{G~D77CMk!lx$RBu_n
zZo8azr@cA;T6Q>!oZXtMdRJUD6j8s4&AAe$J)dGSu@bXFcw;>g*QF^Qj-M7+Bk1_<
zRDn%!ZpjYXrDc;W^xfV3I$+P(K4?0cJ4eYN$;5+L;uf`wY-8p{$FJ$q8NTCoX2E5Y
zT^&aH>Xa5sw_zj1iPeMcS%tle)k#v@*cstl6*j0!A6hN4^xn*foy7Da6CJ<n?>`r`
z1Y?7}R*;3|M>P{5H#h!%BUHB?<$`#h-Fi;#co<7g;_`B2?EK(fIpc8a9MA2y|KNJf
ztK7n*2JwI!A$N`{F2S_NhuEXzUt>V5E;q?hKGBlZvM+Z<%QPbMTd8F^j2^!8JvIS(
zZ@LQrKRXt$)$DguMV(!bI979y+kG!HOn=2vK$@;VNt#~5y$%}ob7bGUaIi8n&2rjr
z-PFTA+vQ}JhP7wcq4(w|oiZ}piO<y7bYB4Yim<*nOh`1j`ABy{jm6{ZbMbR$d(WzE
zVMd7F6Dx-z%2j<d)$BR4n~Bi#uB0~qv4#>-7Fq9@XVeWu51?MKartDn!~N&zuPOLc
z7V0a@KcoPhE6$;X$fXS`d}=Y+3M`~#Y=T`X(fslG{eiTgEZ@z-?@rt}dVhhwzX;vH
zKL}m5DpyhlE`~SpskjmL{7X*p6GFJ3skepvx_sNMcyJ64_mAi1WeqLJrcT65emmCW
zVUM>ed*TEGi%YaUaxz>4^uj{8&!6EiaDKOc_TdiMzt~Tygk}{vM_$vbPVLYGr2y;e
z6VP&Ry%i1a!*dzi{5<?^_}clxta&+4@pxXob!Y?O7Fg{EzwXk-_((y?VWImp7t_fT
zZPLa*v?|}4AoagLVLau@ARqO6(Dg|?P!XJWl`YktAZmeak)CvOz6NLeTG-x)I?AJk
zcR4ui1lA}|O3eBotVN3=A2@}!;esezR)+E`l2W+8F!eg{STmG(tl|@f{nDT`JES=T
zlb0GJ?1cTSw!Jr34NWsct62G^4Fq&oe)H0FPkO;jL!aH6uusX)sZ6sZCq#2j>T#FA
zMpb7Ct5=s|9SFMRF({br9-bj|`xq%0-$_&WUThipzvMkf#)vZX)^WCyBkwAK7kXZO
z<n3;;vztWcaogV&N1a9vwr`i28aJN|fD!jm=q`Vw-FZde!<(;E<SMK>>pLV<0c0IC
z(w_n1C?8&pm^sD)etBMP_mb^g`UVFln+7KK%Xq1&G1W1p;RQ%h+12;WQZ?=R$Z|Yf
zclT=4og3O7P0n18wIY=krX4tluv6s(XHQ3x#+r0nLJZwq>Tu8yv|u2!XfH8F09eR=
zhb_L7gN_QDlTSri(M)2hp?XQRr8t(xy^=QVhU}o>53sd1w$J-Vk<KG!U9FXGX7?4Q
z(G?0~=aGf1nuvbKdtUld732p`K5uZJP2&~7!+8*odEz(w=rh*9YVcy-z#Rp4Jvjb!
zzS3<ua!Dq&AoQv0<=3Ji_@|z#Eh2IJwp4;c5vQ)pftFvn-0JlWZi9A-9Sv71>)eyL
zqih{v%8ciIMKwc-dfg8@Ej@M<7jmX6M>y1`<y{s5)71z7t(SAfNl3vrARPxDO?)1>
zP$bfJ;gR6#DbH?3o@u_)k?{DlSNa(b4ULkqre+FiuEI6!QSE&wzW77=p&l^RBCO*?
z_x9$+Hf`&dhLqnSsHB!d4K{b9JLhC4(hQ<ulFsePHQ>7ny&ozVVb+>l2-Ml@5aS>!
z;V%SLVK21t&^}Hq=kpEvX?W*L!xcAG`0A&^*yD32ZwLv`PC^iZo|ha=3^6aC*n0`E
zFtg;~*T-^SDJjEPDkcWCGK|R3O(@H;;KqIM;FoUy!t)Si{|`J*Sur@4IITHF*DcPf
z!AoJMHr??3>}LK?#vP`k4q4I<i$zU5%~V8Uv_8w7H-E|}FFK9fDs@e_j(?2KGNEJ>
z>jYdFUFz*Y6U#v(Eb)YS9o&wOyX8qw&6fwQ3*jktU*7uddz^?(h_`HTqpW%DV1nE!
zcli;Jh4hy5wu6W@EGCLS#+ql}=V$;Q{o_!DK;wFr_vKoZvF#TT;1KMFYGZtm>6N5y
zC&QZ6^)FRdJJ5Otu+#GEia;>sMPzO&XMQmp>ChE!?0EX>On1WZdn3?y?|z~M)A#j9
zLBWMC>^9`$XF!n#erixnS(LV9SSj_ey1A`{BKvD$t8Y1l+!5S|rjRCKL#oADc7f*2
z9?Z$gfzT~)<=jj8Rc4oy-Je{qyw|K4yJcX$W9oaV@3LOQV0(&rA5J+&K?jVfZ2SAG
z!O38vE3fcagtq;IcaFD_I$D+M!J=J{%r+<f(DzoVghBb7Jk31_G+J*X7XBdvFV8X1
zn7taWK;;?%w=<M-`7nKT)kl6#Q&pvJyg0WMB*qkh#qJ^?;!gOxQ5$0(Nao6iwr~>}
zMXLvGI>x)l8(A*~b4zUJWAxA2=}yg_g(wZUWF+4o+0`1UDfn&P-$+pif{SRW8*F7d
zVk>ahT+@lHw$BfiTplm9z_L`EXl)mRezc%26aQzh#To5KD_JaG>{Rg-@WqAw(poeO
zB?Ni57@XJ-M~G*pus|zp<|V$Yt#cWIBe)<~TfXW2%Nu-n-`H8%m=BS7HP?QdZZ2#7
zU5Q+GrGekmt*KlOOg+d5WGH0{LxJTTNH#1a0jlDXnK272N9)A{W89Itj+TUYKAW?f
zk<+i3`7U0*jn$hu+fKp8YcUyJ7!K<{;xJ7}|L$6Y*{_L^zQGeV*biHI;KzM}u8SUp
zmdc=n#T6vn%u#cb=~!3i{IQCJRNHBb9zBPJEyZ<>)-1qppGfhOb*<Q;3bJ0}Lu&Z-
zx6nL>%hf(HFQ*z-^X{g5{hP-dPihs(D(8_}L-LsNtoYry*05lmu`*Y}o%zF`&DKFZ
ziY*BCwXJ-CGH_cpIeJFxvnaNo6&y!kfn7)0@ClD5+^2i{i#GZ8moOy%h<&GtAwN&>
z>-x3uWxu{ql4W`Whu{jq`sHBEQ!p<om8+r-(?vC;>HT}sLoRU~XTp8L;86K{(rBLj
ztzk32yub|I!hiwVBMa^n3gxm|8fb^PNRLU(BY?u!IOOwIJLVAWcN~G|pEZ8IfpXUg
zdQ8zzItbX*^7XD<L?s=2u6)A&$)#^Nq*GVVM(yY{bh}UF;IF|!P*hmE7IQmPF;7l=
zY4g+rhXU}VGtQs-aa7ogAieO!y0?s6po^jM(oku7W@G+Aw;p)jpySy?jbVZM4|b@!
zg9$0<M{Nxq$si_0(s4yQ&(R>#OAZkr9&69(pz$O=$A3;H{NB-9iaq|Vh-24?dctYt
zH`WEW%hJ8JXCXFzkKlCl@R0GoEJuMS8~Trx>vzc5+J9iEZgzM|O)7jn*yVB|cN=P*
z@qLNjFMg+)269U!!Cj9qj9&AGVj;!o2c;Q$k)?I_rZ9?~n!7uo+E;j_I;QS6Qhe@a
zh-$kZw9tEWeM<sTK;-q&_yxkwAl1E*_U!4$>W`H|)Q1%j=p`xFoW)UBDzdua0L<cj
z&L9bbikN<7rpawpAa1-wMLU)5w{*BC_`5VUxXjn9-vZj$XY^yP*I<aFA*MLbVMB8a
z<%HPp7T$ap^8TK`7>U_)DXa#)^#zB7zFa_cx@b>3Y`@K{dk~FUZha%ovX1}kXMiS>
z5v%U=j)jN*#rj)y?L4^^&a%@#H;C@*d3pu{x}S_k_1C#?W&xx)YJ4SRUzX#sIpOiS
zuU<lz#kFZ{NbnGkLf1s+r6s;!`do>lwT=U8>WF;!4EKI_&<`?4>3l3p7%JDFyX@B(
z;paWz(~T_}WmggPwqaa7CVCvGJgBcf=yo!Q>TY0<rmT#0fQk@G6$pXX+qLW;BoQ28
zp_=dYQYp*Cc9Fo#SaWWTrpfWXZ0Y>O=L7N`7bHQxF~OO4gM>qS^wmKYs-VNV%R%KE
zT>|CTd9#~8(V)Njks-%xx)efr5Q*A6Ee1wir#EwsAKl(R1P5Xg`cVeDZCF3mDmpvj
ze2ioI81Tm>{gP)3qnt)8Hn@cpt?&HHtv4|jBZ_E!Lf6;%)V|mk&yR{4{Tq;q95(H}
zF8@I$ndNxA+C5iuvJI%B4K&|>&}utrGje;jM6KPLRokrAsV;$4LTb`)BcecQi1fIl
z$LP?0e$%XLS3^capAR$mvPeJv#6K7F1?|Y*J0RJNkiuNxznElt)j$~WD5_veE6~+o
z+9=5zbU<h?U<2I*KrD=6s<q(R1Chx(6i`=2^+LZW?uuf!wYSC@DF!Z_GY#TvRr-Dc
zQ?88m?ro>v-v-NmGs0RzOC<H93^&CJZ@@>0i@ilj#o-_lPJlmC^5Q#eddaDm<*08M
zaasZYgU<otNVwf=?J4Yf*e%!33m7QGZ!F90liCa4?Fs8yK#OKE@Kl0j%$E3qRP>jo
z_TKubn`$^;>z|J<K*x_v9-gT3uFJ^rpyTF{g_W+*zU)QJKj<~}*uAipN?!vQ!Hy7-
z-(Pa;bcqhMU?85#_{<?)fgV(?mc<RKw#I(a7c+ADMvNDlQmS8s0z(+VhXr7spuzI=
z5&ViGW)}7-#%lzGOvj_kcnkYOgLS=T0YA_#tM**(Z|#Z5wxVhJr{<=hCuj#RDs4*I
zf&x|_$;B%Qaj^YRIJ1UiSjc2>c7}LhEZ_HtxCAz0n6H$my!qU4{6NW#Fm~%Jd)<2;
z;kL9P7MGu7$&LnxVdTp4;}ot?)t)FGc31Ro#tTs-b!E_#B4Z+S_S5My&_{iks|-g(
zPYH_s<|wMhMDpoRZ7=SR?V0Ryz_@IfNm_J4t~8n*ahnhML+UXMw^%H_mQ*BDj56@p
z$~s31Yji103PF<VkJslsypa5Gut$UL<0(g3M-lT}QtiN28!1*yycYae9e~;Wdu8cy
zJooKsBKQ=AE%%7!Xg+gbqQ`N9<k&!NNgel5hcNyGhy><kTE}Q!bJY4!FF1WKgcJ9Q
z+MEU|YH2v%C&?vRxq4>;&Pe<RxO{!<UytiG99{lsI@_~GdR0X)xvv47f;IWcUL)v^
z1X#?cHwGpg*{O%eG_&wnxjG6aV|RD?nl<&Gtu@_$K}~R7Xi=M}*qh}*rIDtTTmDf4
zd5SH*CvjauLpoo5iq-2vqC$IvIyuPolFaES74MPgv}1IV3CL;<4YpZSnLr`O9S0<M
zVAttJ(YO-m_pX!}O0w)B%B9_Jt~bS~MXoimFBo8?4Mi~u%LFOG3Xwpc9+M-J1IEYI
zZs=FUAU6Q~Q?G05XJL*b{mL3zqHTD21_oEVI=!3#_sSq^4u%A|c*ji1<C^l#(zn}g
zz?}$zSgvQ)u@M}LiO%O;(?PzT{tff%GAA)H(5-56%mZ@};ju}UY6(_fSbkCo7=170
zZGpJ}Y}$HNT;&eaBj=#y8|CF+w!N0euQeUFF7v+dj5gsQC<$q)`e9TtCA;BSQhC)R
zxEiWtO%U`)M_fh<W24)H8N7N_R0Ii3dwem(C4Um&1$8X}<aal-*Qa}?sh_br2|mSi
z=5DOP(-mJr^aLEK1`|n4KOBH=kJ@Id{aeCR>3w)UV4?T2`}7@t2`mJNi4MJ0Dm*gs
z^I++5&+1mq2a#uup!5}IkxrJL7D;9;J<AgD(BPFa+h{_PTxW|e8((%$KWOOb`s0Xp
z7>#UABJJI&MSN_B^XUqE2jPJ*f(ZYn0)I#kvpy?o378O;ixZCWC%oyw-IFu5c=OK1
zPb03%;Yrcp@M!?8$UTsXfxr|PTBR6!2d|}tVm;D8!zie+$qtrIpKj-?*4vZXuH!SS
zU?K<d%MT=*)8y1b=JQi#m7?M9c{eU1Oq(X4<-l=ENXSv+A$LtF%(AIO<N@ro(<1H&
z`}Hkez{H!kbVG20re9G77(fb=JJ+0iC5S#d%dbx_33>{ffy+|!7X>Kvkl)=DJR72P
z@pa_aHROAoCIP-f)ues@v3DWC0Ug(mSm@2{d(0c!*!&zr&$a_6R=>WHm)H;E4OESG
zo~CGA8kkr~zy>Ccg7^uDYcPyR%;#DC)cs$$VlPuy%aS(kEPS+aG&NvQ!)ViUv2?l@
z5j-OC-Og5jnp*DUYdjm~=q$^kYrO65)GyKjOglA#sXHThUG$zHzTT7X6|Q>3q{)s&
z4DGGXKY3DFVLEd{U;N67)J(%0jA4~iUI*BtT35^*=Z#LmTiWn(TlCx^p3*2z(?OYv
zeps9$Dsznk`4z`tDz*JGxH_=!Bg9WrY3hR?L3A*6KIGybP84rnBBT3+a41nM?wq1D
zAurP*BG(cfMC8WmitKUeRs1`5fgQ&eUzi^>RsbH-z+;kxNqD7XDoW655#dQ)n#Pjg
z)dxy_Ix3=b2$o*z1Z+gc)}rNRZ`3~ahbagS<Fan4Y!59}^+`GoCFz-yzj===D2Hg~
zE`?gt2$4ciAb9_40gJ{a9!8WJ?;%D!QTP!zKUn$zFg5h_U-1&?FI0ZcrF%_bycyoN
z49UV$;|OU)L`9{J7BWKrPMOfVHhWy<mFLEe51WlzwyKbtr{x4|cIZj&nR7SDFua4<
zgPQ8V(lCL$m6MITUymW7K$9*!5{V4sRR*P7C^F{hW`z8kJG;pX$w3TrOBj-T?nWAT
zx8K9I`r{@q>ysdvb@pFyRAbPp1Wg2;e>Ri~u_Ea28$#(mky$sRz->U=)wEah;rK9+
z+hi90!rj#EVRuFNsgMbTQ8l4jswe{#1pseWCB=j54674wehDpIpTQ9Mv%$h`?-bq_
zLW1Yg7gr$YwdryD%!3?QI+IM)yK}U7_R(XeQjm=Z?;~)y!yAY$!LC)FX#dXfP|2V8
z`UgeWJ3$#3o|C0sufS0<M-|M0rJt$1&umI!UxQ4B{$I<b6sGe-=yf5TM|E?1uqbi~
z*sMzNSYQ+GmUS0;+y(h0oa4M8Pn@jQ7~B}h08Zm+G*7GJkF{&K?a?i-QQq&E&RjU6
zEh$+4zKFU1vSIAgryzSTd)Kw<GxCWqmEw9B=(Tl^w@)eQkefEC5WS~Vos^(bO!Noe
z(~o4aY!Wh`kkpD<7~`a8Yf8NGT-AX}GD<b!d|6#C?iu@}JS^g}dm>QX5Y~JV{InAj
zOOa*{a;4w0Ihv2o$BC2bTrjuNQAkh?5fO@6#lzU+{Y^aolaq~QbyUvFeXAJEq1B6>
z{dI&{i=^6jQ69DphSmnTK<FMj2IP?;3`D)jua90v84!iSn_RCfEYGjRh#6MHVRN%k
zGv`WzIPX4h_P;dgh5!plkOwuqm6dV0xGx(Nmb3!v%PD{+gifRp{VfE0b2E$uteEJc
zzExyoc&QxcKT&FS!H^JjoAnY%Jw+U>GrO%sZJ$mc%Qm=(TCn7k%9whsQdPs5AA)=c
z-2=Npmz1B3cZ}D!@icaIkM7+7479qTk!1Ck5tKTA=<z6fZGQmc%osRz=uhtiKb_?@
zn^T`6<~tdrFK-OLeB}JN5(HFpo_|$yUY&MTv5emH>-zX!XHWe^R2^h8jkzq=qzq5E
zcVWXkh5fXX!%4s%IWaBJehUi*FZ;x=JC{F(NI@^&WIl54>Nsn@EVif#We<{U5=^OO
zDmlW#Q*W$;NK-IIci*FsUTyRgBI8X`6WohqXYi@8Qe8#ep(RB@=-RIx*hG=i%OF2W
zu5BwI0bOE$SOsXw-o2SVL8oBO<FfA%qha=Br`>McKiCGUb<9_~8YX0BQDObN?!ZEb
z;BaFmxA@{&8qji7FRC1bVlf$4`_VK#Dw!-pTHTzD*ARD52m?ffaD1a5ybp2Hjb1(v
zPGPugdi15E^mDtz#8ztJ{r9;d<V;C&uiIH%@Fb2D515cUi-)9-=bU4>BLdwrU$owQ
z&mS>ep}{Ev?4WAP>#NMFH?wC=Cy$faDi1hyZ11(8i@obVOU-Ts8_O%%`!K)Z_QJ$5
z84%P3XC#9IAryoyGbo|Ruvxg!JZm~8HhQ+1!?k$3D)Y=!WZ^CfhsvmhE-60_#hb-R
zv&D2Q^p+ZILP&v*bamoW;Y3^a$UB87(Qu@44d;96*F=1n=LNj_(NV16lQ-m#oGFew
z#E#l%uL781qy)TA+I4r&IIRmi(){bw1Ae(FD2c-EHXQ^v@$kJKR9fhI19R!RgoQEC
zE1%bdH=Sv{Dm0>nb(hfdwTHd?#smyA8othY%VvJM!#vDghu4utYog!8MTUo{-2JRk
z+vxY{V!Zw4N_4L1aO~x_TD>h4L0`wvNNZqifNf@J$v;UagHD_#U9OqO&;P3jz+z;^
z!-1Ymr^H5^PO1_RXz4SIYYD<Xz*j@`ULc|ZAR(5-g7Pt0Y?(^Xo5=s#x$|-Wy5iu^
z50n3psxlG?K!S~d@Hz26V5$Vl%wLH(K#M5<o6-uvz>ok?E<`#_qW_{CKET7i?MZw7
z_sJ3e!W{@QN<sg|G!O_i)PaWq#17YgP!0w<1jH%QxbuS`o~HMRN^C`pK>jSzQK-QH
zM2YO%I_s}TDx-ZO(N)WnBdc|r>v2_jC5<c$Lz&wRVHU{I|6x~w-hiSI7XRl4K*S=2
ziCN`UkznV{z~q<zPmT$M)H-DQs)-FQ#WMOCkpW_iAe4~OED|8ub}^%!BE@@^;T>UT
zrbWeCz%`X$_l|dJYPIQ%0045N6q|UgdFwRhADQOd(ZeRj6KUpfBQ|Oxs{gWGiI9z-
z1S_gu?h>{UP1dR=JMf4X!X#>6-u`18v3lOl&>)MMly2JO4@gx$PYd|f0*var8$ar?
z&lm!7ax4G|DfL-90}rMXDH~ftPlA`Vbg=cqL%-jGZ-*z<=v!#H1BNYQHWIPv*%HJ5
z&87DD6-kfE{L2yo%M)U!ks>m6$fw-&@@Z6&O`-g=qu92!%eYN5*O;t{f&WwZ9}v}@
zIrN+*IS|f<Fm;?LqLW3t+EPocbyCahm~-Y~vcR7w^uh?bHLon}NX)cSKlHOs6*%5A
zmH*`If}zM(L5NsvFj)VNpxY<2d!%vY#d`Yu|G=kCOTFJlvf*WcUtydnSm>KR|DXac
zEY8kAp6u*y0`(nGA^{XE<Bj=07>bqjv9QoJk{}wtoO(@(OmV%bv|;9BjA`>gM7L<z
z`d+`E2|sKy*L=2{D4&Ttk_nZr{fmYzhl(W@IyDe=JLqifSyRsHyOsXgYSZ$=3~I>G
z=cI3_E#-*cCrpj#?U`nR<<-t(?kIYlD%WC?#NDMvA`t`@Gvt}V-j`{<?Hp8=(8LNq
zvnWi=L__?`l;Ub?WB+##*Z_<9S4<oO(Z7jqI;1ZEswl0cNfP(Ji}^<euyusLevSC=
z9w-LLjvvV+q0j#}<97SYDoy-iVffz_pT`OSjjvzG!u|s|5g=v*3jKTl2~t40V9+o!
z(la&G(b6i>VFS$OdTJ#fNM-xFWl>4>ChnQ7NYwk9?W<dbTXbQ60(V@FHyQk7z1_VH
z8pI;uTZx&#o2&Wj<L3t}<zjrJgZ$RCCXXKI0Ht2Ld;9PH!o?J*)j`qRao?$`x4HGN
zI*9B1lonU=M*N1EE2X~we!p+tHEk3a*#lh15Uihoa{bw6lay-*{U0?)CF5slM`M-(
zoEbGqZS7T-_S*+J9%DX>+`ffB(}us`Ryi<SkB1@wAQv4S@Ci{u6cq^(k1^~!@9&GT
zwZ@do^}1a3+tN3~9|2P>@S<y~!%iIKc6-w$L(uZdGArZ@5EZ}Yu|kH*oW2+8(+BBK
zoo);%zq5GDucaqFce(hSRm=o8BzEnBhvYc{Tk<ZY%oIJLDsKS~aQrd;TA(C(G#Qwr
zBnBxi`a$yKnHvh8dg>zHeee2V$4!Gx2Fv5tBiJv+UF)cA@R>!YwlYoQ#+d4#Hn-Qj
z@Z5Y{dV(wF0QtM@ib>Z2&OO-P%d(e@zk6`jrUc*2le^<)fbj56kURV>3jLzdq}&sH
z<OmtR;qDC+<VAt8Xy&8BUKOBFySPl;GTux-S-e`cdg4i=5jO*if+ugR_s?E(ib>ll
z2nm$GJ0b4cnhSnw2bhM(09C#E<*nnEjScL#%%oGN?-L{SVbYTbyer)QZ6*1A9bnnG
zxm_cqFF$u3)g2cS+>2bF1Sv>Cx0hSA(C&XMfB4fMXI5|mm;9hNu@rBMcm9Whz9o{H
zT145?2~ecPFMSby^@>uQa0dj~)gEAYX5DCY7eyutKY7HFJ(>Hoqg?2bg#VUz8#j_E
z6wLHj{9(}9&3%!4x&FtLt0i>lgeqXr6tKnv_UBUQw?F5rmT<+`$xJbOn%9Z(pS-<h
zh>roe^}?o(-hAifaMdSzF3a4Lg~qn^HO_gMzlGjPpqZ0JE!v66VO8TPB|<3LiC!B1
zho9r89poOVBs!btriN#&>T2pfEq86};u^ZfLZZ7ifYjKaJj}rGq1--ug_!$QlIW9~
zxEf5q>HKxn>+O79_C_`P)q(lNRmahzH3f$$Ps@_=L;Qx)^=}x3IJu@TVauIuDCp%4
z-DWMOTe*kZn_vNFpZTK0q5OpB%nk04My^qAdFTN53AF5+!TrzR$9%3+l{GZl_l*A%
zV(Y!TIG!eM;-1$d=o0@F^YPQLx@*pY@M-xJp4!~KOtP!-`DP`YKgX#u=Ip}t-B;?3
zs=&4+L|YjH0>qENSuY=7G|J8v1xg_xty`)?zFvtO#3O7bbck?%EXv_GGP%`$Pb2;H
z&BQa6etXnizC3il`(>FGpWTYJ&&M5$n-zX`{yv(p#9UgL6?$UBp`2Eu1f#}>@G<LM
zUYS7f)_G~0G;@9JKMG>a$^3k9#T(nQLp9o)yYCBc)$9G=+wMIJmOh){;;g*An3N9}
zU-AI_u+Hx5x0kXiIv3Q7NL2W3a_+yET;bkUiyJ4wQZ`)A-hshnYjfDJ<!h{n_lG+N
z;Q4~pbt_+p(omsM%MV|*Q*~%1l=4b}ddCMftj%CqAEg0uxFABHNRRr9Rsr|bbHL%;
z{s{XKh+m)eun7O2T+nQHy+JF=?{c(_7vH`xE3okAe(K5TRK>hN@T=e>eI8vaNS8zx
zm7UB2g}d5L)UrnBWdpjyS5gaySkZz@1)mQEiVj;-WhpcI_=$6d<zW)fHS1&1>Kkfo
zp>#n7WYD~7XaI=4dg+PRLuB<bXq>CA?g=x)@AtT8`?YV<_vPyjCzh0L9NcSKvBvd{
z<{#tiF5Kh?oWUEF$1$tOAGx-5Bz6SEpFMZ?>|Gp*Pa=N3Ny2E3k0=bf`eA9-K=_MI
zD!Y{E(=Y#YUevC0!VE$G-PT3rAC+ceHtQ)C!8Q4)h>`5%P8%s4@uCv#sm05_0=ZDW
z*Sd$)kjONywK)vgZEI5rGTFI_cI386hV1}y9t*S)^`cH;`$Jd^LvE$1&in!6F#$XQ
z%S-*aaX#in3RlsqRAnBLAWF%ePr>rG*Z!VprFmBVIzwt0Ndj$V2Gq~;qEB->*u@X;
z?n4SGXw96AI!@-v4QL=SXaiw+lH3(?#M`dCdzHTQ?tw{fefzR111<ZTtD92e)yK1A
zkJ(ZcV%)|&<U&+paL2XoN)X~^1~F}z#nse)L}(=hh@$+0EJ(+HoR!PVjDU11c~x0X
zN87N^bG<=0r9Yg$$LCi|?U&fzum~JSBg3y@z2js2P-zN57$?|HzmZ}jqOou@?C10e
zb9=H~1cwMf?5>N6(<b-pl-HF<vIvRD=wc)5Uepoilia*cg<_N<_CE7Ed>$_|??Bp1
zy(pf=mvQnw$d8-!7w2<*tO&6FXlie?Yq-tHut>6L`ob4<+w!y-B6j&yE=^b@h3kyW
zs5YPW+&mTVUAF2s)U<}&=4oH-xqEjU$4otMpxj&QshycF#QE?+acxa<2hTeTREQn^
z0`U&>2dp}mUS0zqF*X8Dvb)gfiucibwe)!roU~ooQ;JQ__4jcnp`^k`!Q{6nh?OaG
zF{%{$XV<Fl><+4CAL`j@-xAFDdV5CE&|W>JP38=<3MIddpptq1C8oIF`?-c%mH=q#
z^G#ZT#^9KsetFL(s;0*0LIYF7V5L8SMNwbM203%Lsn`ypf1mpB?=P#X=e~N~v2k4A
z?!A70>(kJA)^xP#jEPK0J-q1oZ0kt>S|mh<5t&`^n`B&Q%2*KU=Tz&T-M`Fb40y6D
zOuvN`>$~>Y$QI%<C2Duv-O9_LpRPdKYwvfjCgXfO&txd1xvJa!>Xsso``14?Lw{Xd
zeyA(hX|lIbS@yw#fjAnv)5<tr?R^ov?G6qZ8kwqt_z^+qk=z80hxJKjVJOuV8!ul@
z!+ze2NG5WT(!$^u2O$_J(^R`$G)av+$rDaGk7woJ&!X@k+E*_&S5t@^E8h^&);`<Y
zyvKqC-h_A`e&~wG+kVkHNlqhECVvzHhkttp5z!Fm6hb>a`Uc+BiQKcs@7eguS1$e~
zL(JzqAlMg6gLS>7?3h;2?ks6pOjP*tEZJ;&q6gR$Nr?qz`*q<PWRGDn2gE{90Wx{A
z%E)-ok}vFc8!=kpwsj6Scd4Yg_27Losnby(9yt_|euN}g8GSB*4$YW$e_EG&hM99N
z`#UQob+yN2F>&+j!<n-A0zUP=$PAKJ#N~IXPMLG%@q>PP{LQbK>H`)cr_5*{Yu=Bv
zDo(cZDu_iK$B3VDrc<^#7`P0^pgKn!Dg+B&#GpsEX@iu~gWEue@$yd^@nidPfr@!F
zC@KXt8us>tm&d>C{L_k!IQ6?EYMJ?=40{Nf+&oOZn3oMrP+m^xZZB`(48`R+FP9xo
z?4x8S%f?uK=cnun;Z35XO_5xTkcG9{vK|bt>*t((n(;R%{4M5s5k+!r8`OCakpu!Z
zlQk`FZ7OP`*A+$|pskjosMs%D)`!b_q`4hzLg1#^q8%Mi%Q3%yNG`2*E8oaQqUQ9*
zWTRsy1jq#7q35CyRWm`Pw^O1z<{H|W0_B;0sJDYy9-Bsg51T9|plB-xD6^IEagy2z
zAhxslL^OMN+Q<tq2ZV>Og=LB(Yd_@xWn+aHn|(DqK$r0b+tm;OpXfa?;v0T1ucevL
zSjBEt42a@@Dvm1OvdTtW^GBVdDkA^-7G{xVcEo=E4F@lb#{}1T<^Uh@1O%Em^i7y*
z6LWxH9Pj7Zw?c)E@#|Iybjq)_Rd$r3#wcQfJWzlNO(U7@+Dd|WWK>Erbg|j2__{fH
zgJg~p1>S*s6mZNc=d2#}3gU{V$0QNnmr^0Wn60o8$1@wXDg1VYZuCn?4`a+X=gs>p
zB~}!;JMO(6|9virUkhlRXkfnMrUSQVA<Ts(6M+WLYB_xRGXiD;a1CI?;Av4LwJs!L
zltB7>&9et~NwNd2lKek6C6LPKB*LZt{~i8cjsqNja4~_Umq17p0k|m2s>xJJnFsw3
DQr_yr

literal 0
HcmV?d00001

diff --git a/docs/examples/op_fuser/op_fuser.rst b/docs/examples/op_fuser/op_fuser.rst
new file mode 100644
index 00000000000..8646e251864
--- /dev/null
+++ b/docs/examples/op_fuser/op_fuser.rst
@@ -0,0 +1,253 @@
+..
+    Copyright (c) 2022-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+
+    See LICENSE for license information.
+
+Operation fuser API
+===================
+
+Motivation
+----------
+
+Transformer Engine relies heavily on operation fusion to achieve high
+performance. A typical training workload involves many memory-bound
+operations such as activation functions and normalization, so
+replacing them with fused kernels can deliver a significant
+performance benefit. This is especially true for low-precision
+training (e.g. FP8 and FP4) because it involves extra cast operations.
+
+Managing these fusions can be challenging because they differ based on
+operation types, communication patterns, data types, and GPU
+architectures. The most straightforward solution is to provide
+monolithic modules like ``Linear``, ``LayerNormLinear``, or
+``TransformerLayer``. These conform to the interface of a standard
+PyTorch module, but can perform arbitrary fusions internally. These
+hand-tuned implementations can achieve maximum performance, but they
+tend to be complicated and difficult to modify.
+
+As an alternative to this "top-down" design, TE exposes a "bottom-up"
+operation-based API. The user constructs individual operations and
+passes them into a fuser, resulting in the same fused kernels as the
+monolithic modules. This approach is more flexible, making it easier
+to support new model architectures or to experiment with fusions.
+
+Description and usage
+---------------------
+
+Basic usage
+^^^^^^^^^^^
+
+At the most basic level, the operation fuser API involves two classes:
+
+- ``FusibleOperation``: An abstract base class for tensor operations.
+  Examples include ``Linear``, ``LayerNorm``, and ``AllReduce``. It is
+  a subclass of ``torch.nn.Module``, so it can hold trainable
+  parameters and can be called to perform the operation's forward
+  pass.
+- ``Sequential``: A container of modules in sequential order. It has a
+  very similar interface as ``torch.nn.Sequential``. If it contains
+  any ``FusibleOperation`` s, then it may attempt to fuse them in the
+  forward and backward passes.
+
+Thus, using the operation fuser simply involves constructing
+``FusibleOperation`` s and passing them into a ``Sequential``.
+
+.. code-block:: python
+
+    import torch
+    import transformer_engine.pytorch as te
+
+    # Options
+    hidden_size = 4096
+    ffn_size = 28672
+    batch_size = 16384
+
+    # Construct operations and fuse
+    mlp = te.ops.Sequential(
+        te.ops.LayerNorm(hidden_size),
+        te.ops.Linear(ffn_size, hidden_size),
+        te.ops.SwiGLU(),
+        te.ops.Linear(hidden_size, ffn_size // 2),
+    )
+
+    # Forward pass
+    x = torch.randn(batch_size, hidden_size, device="cuda")
+    y = mlp(x)
+
+.. figure:: ./layernorm_mlp.png
+   :align: center
+
+   Operations that match ``LayerNormMLP`` module. Note that different
+   fusions have been applied in the forward and backward passes.
+
+Quantization
+^^^^^^^^^^^^
+
+The operation fuser respects TE's APIs for low-precision ("quantized")
+data formats like FP8 and FP4. Constructing operations within a
+``quantized_model_init`` context will enable quantized weights and
+performing the forward pass within an ``autocast`` context will enable
+quantized compute.
+
+.. code-block:: python
+
+    import torch
+    import transformer_engine.pytorch as te
+
+    # Construct layer with quantized weights
+    with te.quantized_model_init():
+        fc1 = te.ops.Sequential(
+            te.ops.LayerNorm(4096),
+            te.ops.Linear(28672, 4096),
+        )
+
+    # Forward pass within autocast context
+    x = torch.randn(16384, 4096, device="cuda")
+    with te.autocast():
+        y = fc1(x)
+
+    # Backward pass outside of autocast context
+    y.sum().backward()
+
+.. figure:: ./fp8_layernorm_linear.png
+   :align: center
+
+   Operations that match ``LayerNormLinear`` module with FP8
+   quantization.
+
+Internally, each operation that supports quantized compute holds one
+or more ``Quantizer`` s, which are builder classes for converting
+high-precision tensors (e.g. in FP32 or BF16) to quantized tensors. In
+order to enable fused quantization kernels, operations can access the
+quantizers of neighboring operations and quantize eagerly. In some
+situations, like when operations are split across multiple
+``Sequential`` s, it may be helpful to encourage the fuser by manually
+adding ``Quantize`` operations.
+
+.. code-block:: python
+
+    import torch
+    import transformer_engine.pytorch as te
+
+    # Construct layer with quantized weights
+    with te.quantized_model_init():
+        norm = te.ops.Sequential(
+            te.ops.LayerNorm(4096),
+            te.ops.Quantize(),
+        )
+        fc1 = te.ops.Sequential(
+            te.ops.Linear(28672, 4096),
+        )
+
+    # Forward pass
+    x = torch.randn(16384, 4096, device="cuda")
+    with te.autocast():
+        y = norm(x)  # y is a QuantizedTensor
+        z = fc1(y)
+
+.. warning::
+
+   This is an expert technique. Quantizer configurations can be quite
+   complicated, so the ``Quantize`` operation's quantizers may be
+   suboptimal.
+
+Branching operations
+^^^^^^^^^^^^^^^^^^^^
+
+The operation fuser supports very limited branching behavior. While
+the operations must be in sequential order, some operations can accept
+extra inputs or produce extra outputs. For example, ``AddExtraInput``
+will add an extra input tensor to the intermediate tensor and
+``MakeExtraOutput`` will return the intermediate tensor as an extra
+output. When calling a ``Sequential`` that contains any of these
+branching operations, the extra inputs should be passed in as
+arguments and the extra outputs will be returned.
+
+.. code-block:: python
+
+    import torch
+    import transformer_engine.pytorch as te
+
+    # Construct MLP with residual connection
+    fc1 = te.ops.Sequential(
+        te.ops.LayerNorm(4096),
+        te.ops.MakeExtraOutput(),  # Output residual
+        te.ops.Linear(28672, 4096),
+        te.ops.SwiGLU(),
+    )
+    fc2 = te.ops.Sequential(
+        te.ops.Linear(4096, 14336),
+        te.ops.AddExtraInput(),  # Add residual
+    )
+
+    # Forward pass
+    x = torch.randn(16384, 4096, device="cuda")
+    y, residual = fc1(x)
+    y = fc2(x, residual)
+
+.. figure:: ./residual_layernorm_mlp.png
+   :align: center
+
+   Operations for an MLP block with a residual connection. Note that
+   the block has been split into two sections, each with one branching
+   operation.
+
+Implementation details
+^^^^^^^^^^^^^^^^^^^^^^
+
+In addition to ``FusibleOperation`` and ``Sequential``, the fuser
+infrastructure relies on the following classes:
+
+- ``BasicOperation``: The most basic type of ``FusibleOperation``.
+  Examples include ``BasicLinear``, ``Bias``, and ``ReLU``. It holds
+  parameters and state, and it implements both a forward and backward
+  pass. The ``op_forward`` and ``op_backward`` functions have an
+  interface reminiscent of ``torch.autograd.Function``, e.g. they
+  accept a context object that caches state from the forward pass to
+  the backward pass.
+- ``FusedOperation``: A ``FusibleOperation`` that can replace one or
+  more ``BasicOperation`` s. Examples include
+  ``ForwardLinearBiasActivation`` and ``BackwardActivationBias``. Its
+  forward and backward passes (the ``fuser_forward`` and
+  ``fuser_backward`` functions) must produce equivalent results as its
+  corresponding ``BasicOperation`` s. This also means that the
+  ``FusedOperation`` is stateless since it can access parameters and
+  state from the ``BasicOperation`` s. Note that different fusions may
+  be applied in the forward and backward pass, so a ``FusedOperation``
+  may be missing its forward and/or backward implementation.
+- ``OperationFuser``: This is the class that manages the operation
+  fusions. It launches the forward and backward passes within a
+  ``torch.autograd.Function``.
+
+The first time that a ``Sequential`` is called, it will group adjacent
+``FusibleOperation`` s together into ``OperationFuser`` s. The first
+time an ``OperationFuser`` is called, it will attempt to fuse
+operations for the forward pass and backward pass. Subsequent calls
+will reuse the same state unless it has been invalidated, e.g. by
+changing the quantization recipe.
+
+Misconceptions
+--------------
+
+- **The op fuser is not a general kernel compiler**: The op fuser API
+  is simply an alternative way to access TE fused kernels, most of
+  which are targeted toward common Transformer architectures. For
+  generic kernel compilation, consider tools like
+  `nvFuser <https://github.com/NVIDIA/Fuser>`_,
+  `CuTe DSL <https://github.com/NVIDIA/cutlass>`_,
+  `torch.compile <https://docs.pytorch.org/tutorials/intermediate/torch_compile_tutorial.html>`_,
+  `Triton <https://github.com/triton-lang/triton>`_,
+  or `Pallas <https://docs.jax.dev/en/latest/pallas/index.html>`_.
+- **The op fuser is not a graph compiler**: The op fuser only supports
+  operations in a sequential order, with very limited support for
+  branching operations. Support for general graphs is not planned
+  since it would massively increase complexity.
+- **The op fuser is not interchangeable with the monolithic TE
+  modules**: Modules like ``Linear``, ``LayerNormLinear``, and
+  ``TransformerLayer`` support a wide range of features and advanced
+  workflows, which makes them challenging to decompose into simple
+  operations that work with the fuser. They are also carefully
+  hand-tuned to achieve maximum performance.
+
+Creating a custom fused operation
+---------------------------------
diff --git a/docs/examples/op_fuser/residual_layernorm_mlp.png b/docs/examples/op_fuser/residual_layernorm_mlp.png
new file mode 100644
index 0000000000000000000000000000000000000000..a47af7af618ecd42f557a58eeacebb7caee4da97
GIT binary patch
literal 13795
zcmeHubySsIw=W%%N=k=xgMh-`prka?NJvO`Z@L>qx=UIbq`N`EjdV$OcgJ~9-tT?y
zch3FqjC;no<G|SL^{h4Ls%Or%*8Kez!Sb@=7>|e^!N9;^NW2kIfPsO_2GYkUaKPVo
z?ko!63&H5M%xf5!@(8qRT}0rSLjR3|3=E75Eewp89}LVTkma=w1LMFB1GA|E1H+d9
z14Ce)QvVhN6!;maNf^q=z%T-76c|L<Cou3p3KsZ<fhB^uuMJ4SNWv2TE3E)a{~!Z&
zA<zT{;X&pd@O}UD1o+(R{P~8@fc?A147k6f;j%N}|4PFg->XT^^ZEi`sMc@P?SMgc
z-G5+%$2|9d#5WTqHG4G~X+C``3s&6^R(b}k5DV*jEf^4l4@g=V*y~b2EX*zK_#j}a
z-x7R4`aYYDisHA3y&0HFO-7zV*vi&`f`^rzm7Pl95d{SW$o7LFpMr?kgF5g8rZTp-
zx8`GGb8>QGb>d>RvNdAkc=_@r8#^Z(CnpOa!D8oZX|D@mv9zQ9Q^{ZTh#1)E+nQM0
zn^;*=+}EqCXXRiIrlPuU=wCm7`e|=s_;*W|b`Qe>2FP|_!p6bM&h}ra89+?_FKYKC
zf7E`D>rZo_`^xy#6%6dG%pLB#CBX3l^t*-sBlGY6{ZaT^UfI&bUV!sK<=?XZT}$on
z^1qw;XXd{v$l01002BGAUk`2kGw&br_oL&JH-Q+KtBIIc7+BifkA;_$9mMuumi)V>
zu$8%$t)jKAzJUP8gUUa${$2WaJL-S8^PHXgpY8mk<Utd}cK^2j@%I0i*6&=vwgeu5
z*#2dw0*`t`%y?m7IF2MlUMoRhcYYze;Tp^$@0&YD%j{9cVn=-%YzV@|$nXkrId%D*
zHoM`RvLowefq)l#bPT#GC|v<{T{5chy$(U4Z;D0`qVV=R{!~5b?y1{oBQZTWnffa+
z^}T@G;`TNd6a+nUcD#jxj?AA=nDYqU%6q}#X22lQ&o{u`HfwN?h5dPa<?RTI<a!GK
z=y$nS1RDFq6$HN0<+tps`y$x?E&89DjWvX#>gw(>)3uKWrlv7thLtW=D6%Ojjj}o~
z(_<QcB)_yla87MKgeXM!K=aR0(Fzaa@%ved`c<!`E&1A<6P<fEX8K=Rev>OOXC5<*
zZmFxi4D3RTFb*AGCXbnRs+RZ2vDf?&-^hw{8UyR>I%IPJKCG9{hae#(59FRpfE?fk
z{GDAB!V+eVIM+UitWE7HK^-e|N{T#sKEq>~()Ukqc{{m`MgMHuc)a@T>V|QWw)8W`
zYwg2Rij2chVJsS_O_n*-)9;T~Sy_7Rz8o@2hc&q2%`T4f#9Q(mo-V>;70CA&P|18x
z;uWxno5bB6c`Hc=RMEanQ;G}gpiPn;qp3$k?ri9}nI<5ompYn)zJxa-s!Y>~pryR@
znmp)OUX+Dh(3_}0JfSh98qv9r>Fq0j0_0$t_=J9OA28XFR8iSwbU`sIL^fj5^`t?9
znR3&INJ4ts`@^y_ZertdENez}sPA!<l*9&F8yU_yk^83^1GG%m&APfCzSHZ^7Xsa`
zWu_Q$7*4@^3#oukO5?JFBn$!Hi6%)3V_i&VGxm1Qh@ytch@IWshk`1#<gYnvWna&E
zU{%atO0Rk&{AtEP<rSC!*+^=ay@`!^FuAF7zAP<Cirw?eyJni#+M@he&V5@&Fl?AV
zLSDvdgBxY>rgimZC;6Z0!96%%H6r15)h`cbFe3dcz#&^RVSJl}sc7#V8hAF=@M_bZ
z-su@q{Nv;#kJu;v`;?W4w%1q%iY!ze;svbUme-@@?+it%{ye2F{oL4iD!DwWDX3&p
z2Gwv&aF^9fkB&6oje0V0qV#n1c#LvcSt+eC<nVBcDN@z$Mn0#FY-Zc;$yG|@hor57
z!!H}fS-pk%AZNUll`2)L((21h7hiDg<l3{-m(G1(M-^8_e};<pt#A`!7<vkO5lEE;
zD}G;zegD!o{pT|I_S%~7-E{E}`bS!>x`g-%>sIUz0$CkkL;X$$&p=dgQtQ!;yyMAo
z#&-erK=>T#ku2y!{>xz(rx(?0@pg3MMJygRecpktva8z-EgN^Xb{aQMS4L>aw;TN!
zUEG2mbw+WO7cY{v>lmDlm2hdTT#_n94|9$;7f7)^fA%k+VIcW-P5Ina-P>{eh-Hir
z*las@DwlfCvM$?B&kbJ%@5Vy(C+MKK&z(Fe!DElh%vQEqC5S(ES{|#E$)VA7zacBi
zN(A$SWySSd%Z=U{xkfP^n0eCRB1coS0W`QE>pVV7R)ILKZsH`C5dChN=&osH$ej-V
z?9)WERC?lNpoIG!9bc_nXpXMxh3eeym6?oPAD-{*x3I+Lo(}IhqA^`91@#>)jv}$D
zwWw)7l~d-NnXWKy4(PDi(*|NtWI++nk&zRrNLIJaeKNdy%bWJ-i@wci9FTs*zzo9V
z5#>t`4m%byin7Uw5uO=U^p%dJz00_a(^rsX1P>IrY9@~wMtTHQGK_YZ?H`F}L)nr%
zE2>OwyM2eRz!$4>YZ3*rZNYda#VcC5oko=XDLQv5CO6gaba6FbN2m9cEH%K5B_luQ
zbUIPCmq>X}!qXrsd;A~AEVMPQp;-<ZXX$F29DS_c*$x<|R?0D*zSW*O#v7FmdMj3v
z3Ch>G9oz<1=s}BL)U`Ckw0o3Gt>p?@dz>ov5TCkL?%ke$O7U)D#ivD*zV%+8K25Zr
z&_CoAPl(>Z>79t1aQ)?g7yDLdBM`zhA;p#x>W&G!ltj6gBQC>E1ov&T#<TutEPG#<
z%Qns3Y6~yNL4&>Wx!JZDI#)b_fQ{}c7yP2pe3EOv%dd8@=PusVUC3)Ivf}9|{Fl{5
z9>}|X)-2tGcNY#Fo9`sM4$p!~oOFLw+ECuGf6`Px9vQ2^$}<FeyKQQG%=3%TeEY&m
zb1Jo#^*ESh+SH<Rl#)hIN!nV>xg+h)ylF^)oI@DP>djukIHvli_s8}oH)C_*?+y=6
z6HooglOWuTR~Ng}`~<f@XKX7O+D$EfDIV-xO_w~u5kbz$6PKINyd<}g3k<g#GLjoe
znx1%fqTjbAg?4y-ZLa47qraY5(DL4HoqRFv2eHDCy}-8}*X*N5d9zx#18tk5wfQ+B
zVV!AV>k|43R^g8%g}p8^&tngxUE2rxaIR*ei8wZmcjCw~TR5LBg!E?2#>yZ^z8EA-
zOZM<IU4E*f!E|_0zRXQ2cfe~)oCeX7IeHvgWuh>L%n=fTwL|_iroMQ4Dg9$}XqJ!k
zTSZPXF#@n=C9I4uRB8<_TO>@N0qPD+JeQtrArY42<oe>%*jej1RY&JRteQ9$`V#dB
z9dZ-d4RYS4#apO8-7}ny0Byec*z>`ZxaxpkEAQE6j_A<cY&Lp>eu(;ni_dM=Wqo6f
zLdLW|m|}`!f9dvuHEq3wKf<$lV|{u(pBMcK*GYyr;+l<ijq<{?;nu4Y@Xk#f?vld~
znS(jLG8~GW<R-=i5SyE)?HQYuT6%GtQ~PRyF<KVNf|WI;c$X>Ls7#tap9mqRzHrv@
zTp0>WkjPTB?Dl8od*QBhD4jw@y_yme^w_{*+USEIKhKF{qyHPh{P7&4yt%-J(TPve
z=6f%0F9M=?Kh>7hq1(xiW4e>W!<9qEF>hef?K&ZTUkj01aE#GIQDx;Y$?@?g%%moL
z-0`G7Nf=7+=4R~?-N5&pHaATwG~_KNAFm&DM3>-k9qb~xe2GD2LLl_R@AU0omnewL
zS`xBl-xZ)<QSnpGybco9cfETI<&JI-NKL&}Ez=i7(vWjcKkW@+7jfzDrL?5%k9c#*
zvU-foh3&d1RKej3rad`J{25J`{R><UZGw~qf*w0)&%L;KPyF*kO}1DVSsa9=<S`|z
z&5I8@*P;n{B<YT-#yX`O3^g+Ac5*HwA}LJ#jzp6F;WkZ1!6uEjDaur(Ixkpv<Z8k+
zW5~EIMHiwcxSlQ8UU#I@An~eVI1{-37=SFN9JhS^no1JwLcBYLf#ey+%n{Q`3f(a(
zN{YI$Hr64rbQv7>L+8Ji{Yd!H<6~+9ViSd{hu*||P-`|5Qd1-z7b5)Jv>03R;F=}L
zN4XyGQgx;Y9|26JC1i-ZcCLLuv8&IW^ziIjDi2~nfW_sU@U+=#<_E3RPJIWPF6~oq
z5T*Hk0lJ06f-uL&QVW5QNU-DQ(2sBGo3kAim4`Dic{3`|=8NIA>P|xpx<yA#D{ph}
zq^P4UMR?6j3Wdk{=x#io5ynBdFC7j0an0p+uXNnrR8Qn&5*eeno%b~i)9JCe%<fAI
zZr7oM8?VedHz^|}XKgc~leY&QgKTHB;dK<AzMglrXx38orFsWJom<xKBFF6xI1xT#
zc{BDEC!N(5a@FKl=&1YZc#O9Lvse2%9z6%p{U_;1a*nfMuvg1r@9`0y1x9psWbd60
zbX(sJr?zygu<<)GDomMIJ9(se!<%V*oTp)(3B>{h@pGBCwCoV|Bad;DcYJ`?{<7So
zE7wIq%ldV0-tW8JVlMHGOi*(Zbx)_?F=@2zR_(0QXMEW1`NWPE6pWy*+eGT-PWcTi
zqoNRuAMF~dm@ZeFZF{=Z&)IK*b#{(@JNlCsA$t4u4SW(aci#fFCCRO*xiyk(BtADj
zbNsO<>{2jJIAWmb*n&2G{LkA10@*$Yf-aJx-P&;zd5=$hp8~0gY!mz1-s|olvw&+O
z<MvVND9cxE)}Noggf1*nWtXQvY1Poau<2!rW2CKR>;4D{)(LwIb-E&l*eY8|o5%2O
zONEl)kR{;ajUeycx*a#wF)dkRXsI7(?;k(ocjOBwF2uaO={m`pJKvZg@Gwp%T;Eqz
ztFrAWhjyhVSi4;Gl$Tnjc<oNHoz866nh-)Q7_|0RW*Y=1ozbFnKg`s@v@b|u_B*=|
zXO9M^;n*E52H0y)`hT6AVy^%W<ebDEP}w^)TEw$dHOA$Di-?{>R}0pgj7D9y)8)?8
z2)fG&cH)lKAfzaFg;<jH_NudZA|-B8H=`r;nH^2=vKG1oM^evo2{&UNB(e5EoN?@a
z!i7hbb=&aeQcFW2O9#tJy(`TJ4R?IHcU8gy=QN5ZH$Cvci72NEciTYq39n;K_&dil
z^<=1I)6xes1M64l746vu33aNnGl;&fTGd<ULY-s?NHb5gVva~|FKQyd#C}}(D(+UE
zn?B$0)NY(CSF>y=cXZLcF<K5xdVncibV|=ZI1dkn>%N`9_LwSSnZRa+O<)#1Z)>R4
zy4t%UI=51o7>t@qmmi#I#xiGhC+9fn?7M-GdGm{cR$D!abc80f?bg$&qdkc6Mu>gM
z!UnIz(k-4Ru&dYHj>K@L!TBN6>e%~>r-_?-3aGT;M3cO5ybGp5VHDr;=*}m%W7*gV
z;IX+xcu7$|O}wBc^5Qv_qssGb4V4!JTz)r8Y-MtGBdp;!9<f%QO=kkk{FkPCP4J6s
zehaPVp?m3&`MAhAy$VvA2oy<eg?(cSyN#0$fs~hvXy|F3n<&D5T0JeerxVvjiyFTy
zbfQrE*k^^T&{2bS@c3XD#A)Zez8{2l++oQTlvmop`px*oGW}ZFcD>>l>@mKrbMR$9
z?o2iI@(fZF7bysYGBlWU#@7<*O!ytJS`uPkRqEx<2<qOop3em_oHTl49*t}sS9P)J
zD&UOEg)wAuuxtf?&F7NZs$QtWOM6wNu2B>3&d8`si#H9)f41G0s+Pf_bWRauQa{bU
zzT}GYOS$F9g9Y)b(WEI=D~?TxP_a|JJUX5L#IbiZ0*vE{<1VNf`+Ei}`MFE&OIY&n
z0b`HcB+-~u2d)G}&(HdkJcPbs>LT$!j@y@i1tEx-EvGyd)Ro1uL2>0Hr^!~`*?Xy|
z=&Bu;j>|!k-e+MzzJQ9zet_CYah2$+Y}P#CPS-7wuljoBn?;X6+L)ELgCYly_T@pp
z(KzOW{c$l*@`}z$lJKZmBog$5<0yqtfDp~moQJ7f4epJ;88?r0$A@Dqi2krMl5cqi
zBY6jd^yhhX7?ook)aPU$_1tKg>&vI6*oztaq55yUF%Z6d=@u3un&H*Sb0=D0*1q2P
zR3kiTnl#lC=+ib#1FT(^eAf_<#lUGR>>-kZU%=^jwZf-|qsu4oY|%SGxtnL~V~}gM
zm0IzRK109x!kJOS?fzgzhT>hn@yriI><S>R%ULV6mo#$LVvw`bAmsz4!G|PDZ`<*z
zAl%vAyg^4SV@1B=$hfn<Iw`eG2+H$-P_X2VtOsnHSp{BJS99xBROW7=l#tbq3o6}o
zWN62a@REBT<rTzL=Vk`0>g_0H<tTt2G3D$tkd18dw#UDX#|OO|KHegYNsyjs4JS!U
z=|(VGq-oBJ$L2vfCmo`{8H&CcoUBhs0k>*wr0!U#t$63P2$}d7K3PO2!^GHjc)S|Y
z0f%G#KB(4zEeV5#Zm?s2p_7F_ZJpXH^@X}uLt^Rat;^FLd9%=}gDg_6yBE1&7s@c*
zL3Wy@pMzcy=4{i-ch-edg16V0f%(@tF#<{0eAtQvu1xs4&eXYM2MF2un^!Z<l^l3s
zv0?n*3CIfPs)}@Wo0goKTTUclR%O1lM|HQ9?nKx?w}bs5W#u~)c@W&2m9z%-$CuL!
z=?l8oz>Dc*`T6<gjyf#7Ozo^blbkAL={2cgW%<;>*jp*=4i9=~yzj#vtnOHqH-uD5
zyrk`r&!2Vgvg&#Wc094sCd-hpvr1O{BlMj+tAuCC(@%{+rLQ?DG4O>#xV*JZP#7BZ
z+N^ma_=P~C?FN`mFO5!asS(PWQK1`=NDG2ohMZ*1BqftU@wN5A$e-bBs<~5>Um^?B
zgA{@>`Ys{jS6^_mdlr!>)!&Yqa=5QyEPF{1fOxr|!g0j4*TPl~!tBX=1;icx=y9=$
zP;9LDjym+Sk9Ua!N9B#qE6+yVngqPTLGObw6XSN}_4=R>#<@q8YgQ~;gT@8z(X<>n
z_`E4ir;h64VJ)8g+ltKQA*g*}=#rDx%QDZV6)s<==U0x!Ul+Q^l^oBhT?AdRUUif&
zKaKWD5O3>p9RBH4){H=T-CJ-W`V78mqC8@JPsnm<*zgzo_ENC{`C6xpu<JsIZhG?2
zblOH>g;{2}&Yrnd$2?I4*@2w(h1*$rS*Jd56yNvmyyOpq-^U6SdhCk5T|<6#JknTC
zUSb9zdZwvh6A?tlAVRUAMaiT)@o}evTd;)Lg^!OO!=!oE720+4zSe%8iSW&0E;&|I
z<SXe(L$fZF`S^}$qVn(p#)TY752@`ewHOLqNZaXF`GJ}Ti3fG_q9Ktda_+$CclX()
zi=74J2=9Z&r|`}kG(6j$W27FB*~+c4e36#D5bGgz4cCQrO!@~;_z#{WmhzpW`^Y30
z-%z5&Juel!CK7u$(GC4h{G&aEEbby^#N5R~vBbLMTepvM;h?nzPYVx6xRdJHn`KcG
ze*s@S$ALIL>1el_J@1MD3n{eKl)1eP;5gXD71KRN)W4&e0`kg1U9T56<@NO3S0@S5
z@%5}#ZvVBM1FsF7GM;94o+Bv^^m1{Se}dRuT<r3Tww`jOd2IPoj`&!NYw_&AC-lqA
z(&I#8%Hb!N59}xn$>|Dk^2|P}SCgG-c>nUe_)GVqjQA`N+QN}>1xIa#yzhhyO&0eE
z_kWS&FkL>vF_YrA7fcBzt95JI6CjY=>FP)Y%tKYlt%(dv;%Djpa|E1oGc4FatF7_~
zw%*(6OT}NP0g&sO!t3}zd7*f*B>#rHupSAc>>1k)ulR!}g;ZmBHCFRI=8p*Y9c=~z
z;ypn)<IB3Js_#GD*gGipZ3;uJSgzi@+3=nt+X}4M(rcZm+V<4~l?9HTs9{kV?v~XI
zXj5%iz0<|xO_QOr)n6dwBcWZ~4<y=OU#|*Zo5xfJk<NDUD1^AyPrrI4q^G-zGu*r2
z9eiGrimhMIFLHT%q3CHrz_7KPvlbSkCQ6m-G$BrN81mEw0*`i8u0np~Dx0dR(MZUn
z`&hzGqxdIwkTXNSot_F#CG{yz+UaOdCth>$vZQLKyPCdP4tuxIk5n`r&-x$JQ;R#A
z9_p^>2?mc<Bttqh-ISL{n0rgp4b)#cfqK(w0t=0MI<lKo7N?lfo_?3&m}H$L)Dff=
zA-=t$quQ?N686Jjo@=Xt?3XEjYXuL@T#dLeByOKJf;C-J>q8v#KdNfGa7~=a>vlA4
z`8kn_xjc&|2;U{CBtsK+B)eOj(_mHXFx|l<IwdXX&?srabp}Kx8%qcjev<S`X^SG_
z4$N>hsn(g5etuD6#2PtXP?*1!V+%%BmRpkAu&6*C!xemAb%t$tqD;79p!%%<K1akQ
zkMo0`E9~KvS*?3=qa|GxRQ{(~=}qw0=Hg6`{8^n+d#etG$Hiw{s^3a81vVwQn;e*(
z@nY!!3{LXBD;`TD9oM*upwfow-o!NSPQ}z_R)_+9<V)vRdAy@%rEfAjkxHAMD07cv
zDHCn4xTkCDQFEw6=koF*LgAJj9+$0k^i5Yrgzf=A-DCORK%F)fZ}i*0I0JdFwpq%@
zI1e1cSC&?t(w$TN4TgIx(hCj~04GVGaKQe-CSOg%p`T7!3dW^95Dx#X%JXP#0@Sps
z)8T^!$7=?w4pVEXq~XP*0)3$_&dA5dl~HH*SiCJ%rOB`5pdTCaT=Q>Y*$}P(_&PsT
zy>f*sxjoN7pk#8<Ny|FgQ~ndf=dCkPLwsY1OLTnWk4O1yi}U7vq`7DQI_Zy7x1@mM
z?Dx7aPn*w)!!~~6xP|f7?3w$%#sjA}VwTF6JfkROa>0zCDHWztrjhTWfjT^XUtg!H
zp~XD5x}h#tKP$%A2kY=UTuFft*Y^RQ)_P?@fV@EyA2pN^A5TY<`fXSQIgj`n-Cy~F
zku9%dalzy!e>s_i_UHqgr!T_<E}k(uQ@-Xx-w~rtiHZ6Vr#>wrvIs+DT_dQE2`aPr
zb~zS>hV7~IN}clxz3+hG(YN5(7Ysf(Lq2u>u@{mbO6=1T7<<5AG6{NjD(4FTcUR#i
z)3l#|y>qBHkw(Zv2(?*3rFX$~?wj_7Va42T0-x8O$9;3wDoTaa$|1UDssPx%p1#TJ
zG&PA>t9(#@s7u0Q?u+E3&{d5hnW@DtBH<zs_BS>aaSP&Q<*%Z>QnNqcYEMlU7YFN>
zIZw}Z%HlIyg|pEn%*SY@ioY1PyRw3sDf}9onQ1p)CQ8oI{Gkh`(2Tbhb>7=Pokl<9
z9E6}e7?Kp6Kn2lzsbyxS2h_U~u&lI`)ydx&xECB50lV{c7>E+l<8iNs639tHBA&!9
zH+NM=ZtIX`H~Tj>ZiEOi+AAU)en7^b(*mYjj-+q%V7fo<k#eT);|IDc9F={-tf);*
z^8t3hZ}3M5#{=sAN*{P6GGoV&f3WN#0EMsAla~8KkqssQkKIIJT{(YH`4>#BE#dcV
zH#{5cARpRbeShnny8EFv9nkg?ft{U{^3&ryLz&-Oq=ZO8LnF28@e~yRk6V}ZYHQ|y
zx~nSr%B9gLTlEV@0vjTI1{XlarE=HuePN=R<r*r?Dpq?05CH@Tgxl_!cvWhFX-i=0
zCj99bgIpLyB_?2)Q@IB>J`MzXPdD6KcGQId;lJijmSCL($d)5mWV#=yCALnP6FgO=
zwP>pVP;~=UpZ@*y*wg83?qclbdG#P*@A=yW6O-|C%ZUJEeT4;goyF&3Y%mu2dm`*v
zT20)vcm<jMOoR(i-MBDQ<;UNXnqda?`+p1n-%JAgMrKqI^}V;8Jz8dAOl!!_{tjA`
zmKjJ+8(Yzsk$|;A-TyJGaR>qo>Nk%h3|KUo&#K9TN6kLbDLab;L8bm!^!_Knq60IW
zi5}dc1~9fJ8tBozl>*cg=vk}I9;I<wz=J!m0E4vZJ8FDzCM>|2Tv3wpGXJ;(M5<M%
za<b9EGVR`dyaEth&V~7Yjrw@%<N?NhRtB@T4MzVl4D31Y@LK1(g!kjLUBp~ARHO^O
z0=*b&?+5&5pA>fEAT4s%>D@0n({`OboPl0Rz<|@9e0l=dGkBB;6rlukqCi1f{N7Hn
z*IxqmT$!E^Y(d)o;q6pF<)#GdtoQ!Yv~v7T0Litf8nh(?`>2+7@Lsfm_FEPnu1=XM
zcDy>UVl=bpkl(vcLvfWhfAknr>*4(}vi})ovB}!erX$pUp@3m973MBq)`@fGVHMba
z3@f{I^+vdY=+88G?*fz75WV2>FozK+0K@*Di*HL1e{;Q?C3A`^+V@=VmkMJo+>l1C
zj9M!K=U+yBDZtt_dJZf<Z204P7CaZpp@p7mn)`2b4Vnq07Do!8-}|{PkXKGqSz_i2
z^udV$BWfD0`c~Vp!~?dZTh)`e;IrRATz$nQX(%QrKa<@GEB<jbKX|Keef}85E(!oe
z%%fF*22cPeihfNTz%G)EY1s%Ws_X2BBWnoAA-&&MtS^p-D^|nhk_~wL8&abAxhP8c
zx%pQ_XJwzwWQxNIRF3Nx@+%wldjh-6vG<#ZcUkxe>94|5p2$Dv_`}UMsp|D5N@D=E
zn;Ii3$HPK5I9y9NsrVFMj39E`uA&$WN2$Jjf5`aldp|c|U8R}bheB`5KZ09~o5j+H
zoi_aINs8Y2Do<)PZ#~elA%~oH7Wd0`VG~Ge3fN`3rj|D<8Qlcjl3|#taRq|2xBHla
zB`m29zr`-u2++48x(H0<?-mbj(;%H0<_FBI%2gF)64Jvv<5{5m)iA#+1~-1F<R35i
zMBS>xCLZ4NaQb=vr(b$+AGQ!%;Qg-T9}qsg-vHo|dqj<y@nIAD2pBI3H<|FCx(4q(
zDu5_d^kI+aeGF`oS>5^%{znA(-?+SfdH#b7y#yx8cI2yv^z3K7V%66JE5LcLSXeu_
z(Ju-mC;9{WDWA#u@RyfP5~yqldBL?Oh|a&hO>%G@I^u4ua%a|i|J<+yHVqyS8$t*V
z$hogD->b8K5{pJ?gYv0w6WP1EExvC}*o0w7l`U-}4!JW|?_uj2@4&MccSP4=w0Am!
zg5=la1P<N%AgeV_V?C_Q=Rc*%=%2AolD#_p!H_LIvLxiyz9J(Rt=0*9KrlekJgCDC
zVD!vInpH*Cy9-I=IVAl5;6xYeqRqzeTWXhEI~FyfuLPcR+{_w{EvJ|lV>>a{P$Ejs
zPNuHJI^i$m14IWu<As>{cumY6!`*4<FHiHTwBxc5@hfK-v#f==0jUZQ@Fdo#PCKVP
zL#xglO(@$ouD}AO+2V+Q>-<{8o0djvZGE%R<uGKUWzgAXzyYS5Hv+OOvz0N!9;bnq
zr}Za>_S@n=9OKlGidBnZokg(x;iGxn(nduT@eATGe6#O8{Fa-<;De%BCz9gn#_IEQ
zvbgPvYsNKhBDiUD7QH_B@C7m9R{(M|fkT|)@VUGdD#vms{GmK$F+fB+;zYPyXGT65
zc;8d+I?+~aPKC+<*dAcjsG~|k+3B)s^%eIL2G@4WTD1*Mrd9F5O*M<t+4~Dz73nhQ
z<hG3-;{a4mm})Df(!UIVXs;K~Kiv|nf})=Y46PbXd+JTn@mp=mFWlO2vF_f1kZ|zL
zhJjc$6kW1Sy&WFM<{V(9^$|W{^PDfHtVOp6rkWSeXkOkPw)gN6P*C%o{gbfl(GZl|
zv&NTewg>37Nw4ZE^Vc>5E(lj|>_VD8=uHetAvZoDPZ}N?D{Hvk@^`)caEJx>IKz6R
zJIkv0<uTUe+R3hW$$qX_O62sJH$Yly7PWhwqak-f&#kX8+S3|-TwVk#_hCshb0$+2
zjg5iv=9*h}7&$mx2-1v5i?peCH_8qsmg^g1IaD;v0&ldM?GrTO#U<u89>pA2vgeor
z@rCmAb263$MFOAD%R6}37wsv>w_}BGzggQ+Sq1>42d-)#TIJnG9l?S<cmU@F&Zldg
zT7xqx5!1&D!Q&Ly2!z5`#7)f4**(lA1A{moug3g{Eiz$k(+FCJF!4OAe7{{MNP6QG
zdobuH;Do1KJnO3WbAY-T^?AT9=vGu{BBMav?o63^Q`3t=@!7|4%-ySw1=UAPNBrqs
z9j+;hv0ByhUhC6PwNxUGFMSFPyZcgYupFPC?aBZ%Pt`AuoEIV0VCUXv)<oSM_NLxr
z?Z6*JH9<4dU4ff~KKZPFWDZNBmiZaQ>4z=UFb^>rXlG+k*?Okj$obb^uJBt!rNKGu
z{gE@16PBL-?w|t`&)f3l@a!_mc`)4#n~LDpp-+$B^G^VCuhlYfgpPDKkV8IF6O$;T
zn}9A{4JdWMM_0$V57L=x+RKw4LjizD{buS?<m0sRt*F@XvoOs(12E<CSjT#ssKul_
zYg&9@;cG9n<B`EfU+Cdk5fswyGK(OW+OuWA&LhBUCtJqgV$zlp&l|>6@N2}d@|hn-
z5T<0$2z?ZHwMt8w$8z~4>2!p<Pblf>aRfiP)20+w{{^I{zw~tW=C+!Nf4uRl<@aVB
zsji#AFXPl4yI+B=FD${XLO)LoIgj*<b|`FTH?<YjWY97(AHk~^*U3$1?sZ0EAD7aD
z>zr+b`AWBirpzty=+2aR@DsxqjPmZfw4X$?My#9(AqaI)-lfzY9f*(<8|qI0KB5i~
zI@{4-mR~(>44U!9VeNs>1x(^IehYaM6~AK=JB%o#*>K;LkZ@rkNWP5;xyk)x{w!(Q
zluMshi(@@Jks81H9r4eFWEKaM9rz`-W{(MRL&e%j+(dkC9<XUU&CPpkgA$@^Oxtc_
zysSdqVAUljP2*F5UOaoWAy^Itzu|edaCn?=qi4D3Eot8CrSO@sfA|QlvGT03ZWUU)
zIX}k{?kV=IxOUT^N2VkECxEK87P)HKJ>A5ALKs@$+E19Cels%I$#j4FV>4GT^GEGy
zx7gd!vmsPJ26>U(q}(T+WfPy6NkXG@#lpJ9EQa4E54ZpqDfn?;^|lNq;z+PXnJO*@
z+_Qbc2Ohk(9J}f*(`R04BQZfg0SYLf>TwUT<FtA8pw|R<V4C=LPi4Xt-S(aFmGsQ}
zkYI-j?+guv%Exj(-FXA;*KWY|i&6`a>zj5wHGe*;jQ|?N2us!*==ySUhVJtO9<qzM
z`nc2Go5>PEkiBCcz?~8(7q`#jIW4b4;TH|B)eiZPQX^ND-00x46r?nwdr_>>EdU;j
zi7Z!#Zg+#1#F?7Tk?#k6ZW|Jkk&xvnf1M1h)BT}UD=G<U^kYP6<NM)TjhW$jCr#_q
zi<>mo!s*kAZ|DB5hNzEfTdsTRGv~G&1Znh^YrnpCTx8J=*A{|Y;WkwYqHMm%ZoVM&
z@T@wUb)L&ZxoiIA<hcfilBi*UZv_3U>2i<l129x--&`26B1d$v`>t5_-P&a&w3ygW
zLt(pzezRj|yro`O&rE|FUm}QsyPndQU@5cqlSl1B_hOW_ovjxK{qwT;{nQ~^sR0Hs
zJnaIkkE^A0vAzK6bZu~t>f8O!M~Vk3$=uH<#IVgwi@T9%mBMaet<2k{Z`l;#+8fR-
zOw5dWunghY1-gmilU6%)SG6a6H(0N$p~c`-PC?F$7zPx(ldtzDWtNg3M=u>vTf@1@
zq(4fVzVB30YBFqez>jm!5f6vTq=$pm+{W2fK_E^xfs<m;mDMtVQpqdh#HfQeWekk1
zgipw$nslxlULas`0z^JbFRpSaK2QC%mV8}B*N_)CtQw7%_{ag}OY)s_7Fs+$+*c6O
zK?6+f$qn4n?I%ctzT$LqVJ08^K2ui-F41cDKRQ4aCTC72OtMza;CKdHV6i<9`Wx-O
z$xl!SCFX?KM2D+??m5C?H?iOOga`qBEjiC=`8YRhT+o(!IkiYI)$%RDUO$5Y7aH-3
z*HteweW1GGdV0I|NPF(NiQANx8u+qfA>NAUK-sYW12Z?CSR68A{CnPG;UZ($in3jV
zwDt7UFYy>|7VpMD%*hiP<;JFC`Vp%tIwS#BQhMc~pQfb*KbFhwbz3}@w*>K59+m*R
zv(t^TjpIf<%t8nc%@XCz81=4ReRG*<*N_irMq`f8MM7dnF1(l<U=Q<wdmU<v+`wHJ
zutLMrae1YRfw2(J1ZdCj8L&gTygqfyW-j`MwU5;nPOHMRkgjt8;KVF>mSF#QLXrvM
z1w&&124^EaXPXJDR%bbn6TA(RUV}5IH}Oniv%&l7ek*A%wdQcJ9rRQc)1&Z9IRrR(
zKQ1Ywmy6L<y{01LnFAee)vxLUaB-zxu3vIAyOPl5)ap>_*{`+5f+k2UXtv_gBBBI^
zAf!ph^@_{&dVY&cPv>@eQ+m7nq6$g}jw2txt^O5p&JsnZLbD)D>BhQ$yL(u=S`sEo
z+fL|o8g(jYeY}5&ecc@;aV<7})1u{cZGTL<Ai`Ee?vKgL6a9%eis677OENf$U9J>`
za34US=vF0S@z-^$Nbxs<jGQ2-*sN-Lm#n;H{j+n>pcN^#Bm!gfj`5gsucr|cU3*MU
zFBqBGGc$AASI5V6TaM#(y@SJxV;6a|`3W-CidN-rs;19iM(t>SHElW0?#eDNd%)*@
zEYBtp_b#j|h9yp@6*w_pQN^G;+UBccb#BOAFLQz{I#dmabM)_&%@xEyaZcR~l*RK3
zuA&FRhb|Sns{R1iaa8peVaIQ1X(k%pQAChidDhuq_4P?<*Elg=q0=1ljbiN_tyRlC
zvi44s<0;IRln6eK;?(<Gg3vo18!~+wsY*qY`Aq1-jT6Z=-D<IfsaNXNIIHE9ls4~c
z$5agG2FH!B@$#u}jvIX2v?DB_QeK~nWwj3(87VmIPKATz`6Rk^N}~e=ij!pB({I00
zUkLfYIMYz{$q8u(JN|u=H&%)M9Y`PFgEw>4MgzYCj8}9(48UjdKT?=DYHnWqBd9Od
zx$GSlKN}a;iGuJ(Z=o^Mr{8hqeY|f`6`v<%#^W#d-EC&rNcr3ixFJZP=+{mc83T5v
z;pmeQ(XO)v{XhneaPDPqf2q-U`f`9>eAs@?WU<z{8xf;_S-)6z(0{*^g6GViY#m{V
zsASVOT-;2{Xj#r92X#@v5sg)N0|bXrQA1oNz-3V`;IgQ}>O-L9oR?4QX$M^L0kF|V
zJC~X?ys98fS@H0hq(Z60$Z;A0apdUnNbI@sP_H(_$_?P=avmC7)j*DNI5Gh#q^yi{
z&fmPzk=}66MlRwlTH2CJG4`+YgvMXfwF{(&^{|oZ#+m?fu!OPRwx}<LdnR!qdc-o8
zn}g^~2C9_G6H4g$gMaQRXiJhwYtuN~^cK>yajCWd%gW{S8!eizlSMLdQ}bT*4tRxE
zL-SXvwaGp2ig%;)*GUf<rwEsoW8xDF)qy4kiaRPE(DoS$AVjr%^#T7O2IK~=<QLXC
zsPQ}mn8ZMU`OB-9`5|O9#RuRDyR9<w2XS5iUuXb&{t&H>FayT4I;Q&<X8IS__i%GK
z|35dbvxg*N`1(({DqjhVBuOLCAnOl?Q~Meq0x*L5ef}Um8HRubaMxgd7yBb_?F)z#
zV<#d$#J&UfalR#KT=)Y(ganB5QgEU@j3fy#iqRQ9X5t4h>K+#O|8(HqcgWd2Biw8|
Sk{I{@x+EbgD^en)<MSVz^hgZ=

literal 0
HcmV?d00001

diff --git a/docs/index.rst b/docs/index.rst
index 4fd55d241ce..e68f577cd0c 100644
--- a/docs/index.rst
+++ b/docs/index.rst
@@ -48,6 +48,7 @@ Transformer Engine documentation
    examples/te_llama/tutorial_accelerate_hf_llama_with_te.ipynb
    examples/te_gemma/tutorial_generation_gemma_with_te.ipynb
    examples/onnx/onnx_export.ipynb
+   examples/op_fuser/op_fuser.rst
 
 .. toctree::
    :hidden:

From 4ca507e496fc0a33fa9f565721f56300a1a54217 Mon Sep 17 00:00:00 2001
From: Tim Moon <tmoon@nvidia.com>
Date: Tue, 2 Dec 2025 21:53:20 -0800
Subject: [PATCH 2/5] Include TE ops in PyTorch API docs

Signed-off-by: Tim Moon <tmoon@nvidia.com>
---
 docs/api/pytorch.rst                          | 64 +++++++++++++++++++
 docs/examples/op_fuser/op_fuser.rst           |  6 +-
 .../pytorch/ops/basic/activation.py           | 18 +++---
 .../pytorch/ops/basic/add_extra_input.py      |  2 +-
 .../pytorch/ops/basic/basic_linear.py         | 52 +++++++--------
 transformer_engine/pytorch/ops/basic/bias.py  |  4 +-
 .../pytorch/ops/basic/layer_norm.py           |  8 +--
 .../pytorch/ops/basic/make_extra_output.py    |  2 +-
 .../pytorch/ops/basic/quantize.py             |  8 +--
 .../pytorch/ops/basic/reshape.py              |  2 +-
 .../pytorch/ops/basic/rmsnorm.py              |  6 +-
 .../ops/fused/userbuffers_backward_linear.py  |  8 +--
 .../ops/fused/userbuffers_forward_linear.py   | 10 +--
 transformer_engine/pytorch/ops/fuser.py       |  2 +-
 transformer_engine/pytorch/ops/linear.py      | 16 ++---
 transformer_engine/pytorch/ops/op.py          |  4 +-
 transformer_engine/pytorch/ops/sequential.py  |  6 +-
 17 files changed, 140 insertions(+), 78 deletions(-)

diff --git a/docs/api/pytorch.rst b/docs/api/pytorch.rst
index 18abe0f2c24..f47a31b6866 100644
--- a/docs/api/pytorch.rst
+++ b/docs/api/pytorch.rst
@@ -143,6 +143,70 @@ Tensor saving and restoring functions
 
 .. autoapifunction:: transformer_engine.pytorch.restore_from_saved
 
+Operation fuser
+---------------
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Sequential
+   :members: forward
+
+.. autoapiclass:: transformer_engine.pytorch.ops.FusibleOperation
+   :members: fuser_forward, fuser_backward
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Linear
+
+.. autoapiclass:: transformer_engine.pytorch.ops.AddExtraInput
+
+.. autoapiclass:: transformer_engine.pytorch.ops.AllGather
+
+.. autoapiclass:: transformer_engine.pytorch.ops.AllReduce
+
+.. autoapiclass:: transformer_engine.pytorch.ops.BasicLinear
+   :members: _functional_forward, _functional_backward
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Bias
+
+.. autoapiclass:: transformer_engine.pytorch.ops.ClampedSwiGLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.ConstantScale
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Dropout
+
+.. autoapiclass:: transformer_engine.pytorch.ops.GEGLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.GELU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Identity
+
+.. autoapiclass:: transformer_engine.pytorch.ops.L2Normalization
+
+.. autoapiclass:: transformer_engine.pytorch.ops.LayerNorm
+
+.. autoapiclass:: transformer_engine.pytorch.ops.MakeExtraOutput
+
+.. autoapiclass:: transformer_engine.pytorch.ops.QGELU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.QGEGLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Quantize
+
+.. autoapiclass:: transformer_engine.pytorch.ops.ReGLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.ReLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.ReduceScatter
+
+.. autoapiclass:: transformer_engine.pytorch.ops.Reshape
+
+.. autoapiclass:: transformer_engine.pytorch.ops.RMSNorm
+
+.. autoapiclass:: transformer_engine.pytorch.ops.SReGLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.SReLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.SiLU
+
+.. autoapiclass:: transformer_engine.pytorch.ops.SwiGLU
+
 Deprecated functions
 --------------------
 
diff --git a/docs/examples/op_fuser/op_fuser.rst b/docs/examples/op_fuser/op_fuser.rst
index 8646e251864..9b4dce2acff 100644
--- a/docs/examples/op_fuser/op_fuser.rst
+++ b/docs/examples/op_fuser/op_fuser.rst
@@ -37,7 +37,8 @@ Description and usage
 Basic usage
 ^^^^^^^^^^^
 
-At the most basic level, the operation fuser API involves two classes:
+At the most basic level, the operation fuser API involves two classes
+in the ``transformer_engine.pytorch.ops`` submodule:
 
 - ``FusibleOperation``: An abstract base class for tensor operations.
   Examples include ``Linear``, ``LayerNorm``, and ``AllReduce``. It is
@@ -248,6 +249,3 @@ Misconceptions
   workflows, which makes them challenging to decompose into simple
   operations that work with the fuser. They are also carefully
   hand-tuned to achieve maximum performance.
-
-Creating a custom fused operation
----------------------------------
diff --git a/transformer_engine/pytorch/ops/basic/activation.py b/transformer_engine/pytorch/ops/basic/activation.py
index a444facd0a6..229a7661b60 100644
--- a/transformer_engine/pytorch/ops/basic/activation.py
+++ b/transformer_engine/pytorch/ops/basic/activation.py
@@ -153,7 +153,7 @@ class GELU(_ActivationOperation):
 
        \text{GELU}(x) \approx \frac{x}{2} \left( 1 + \tanh\left( 0.797x+0.036 x^3 \right) \right)
 
-    See `Gaussian Error Linear Units (GELUs)<https://arxiv.org/abs/1606.08415>`__.
+    See `Gaussian Error Linear Units (GELUs) <https://arxiv.org/abs/1606.08415>`__.
 
     """
 
@@ -188,7 +188,7 @@ class GEGLU(_ActivationOperation):
        the first half of the input tensor, while PyTorch applies it to
        the second half.
 
-    See `GLU Variants Improve Transformer<https://arxiv.org/abs/2002.05202>`__.
+    See `GLU Variants Improve Transformer <https://arxiv.org/abs/2002.05202>`__.
 
     """
 
@@ -202,8 +202,8 @@ def _activation_backward_impl(self, *args, **kwargs) -> torch.Tensor:
 class QGELU(_ActivationOperation):
     r"""Quick Gaussian Error Linear Unit
 
-    Quick GELU from `HuggingFace<https://github.com/huggingface/transformers/blob/3e93dd295b5343557a83bc07b0b2ea64c926f9b4/src/transformers/activations.py#L90>`__
-    and `paper<https://github.com/hendrycks/GELUs>`__.
+    Quick GELU from `HuggingFace <https://github.com/huggingface/transformers/blob/3e93dd295b5343557a83bc07b0b2ea64c926f9b4/src/transformers/activations.py#L90>`__
+    and `paper <https://github.com/hendrycks/GELUs>`__.
 
     .. math::
 
@@ -285,7 +285,7 @@ class ReGLU(_ActivationOperation):
        the first half of the input tensor, while PyTorch applies it to
        the second half.
 
-    See `GLU Variants Improve Transformer<https://arxiv.org/abs/2002.05202>`__.
+    See `GLU Variants Improve Transformer <https://arxiv.org/abs/2002.05202>`__.
 
     """
 
@@ -303,7 +303,7 @@ class SReLU(_ActivationOperation):
 
        \text{SReLU}(x) = \max(x^2,0)
 
-    See `Primer: Searching for Efficient Transformers for Language Modeling<https://arxiv.org/abs/2109.08668v2>`__.
+    See `Primer: Searching for Efficient Transformers for Language Modeling <https://arxiv.org/abs/2109.08668v2>`__.
 
     """
 
@@ -383,8 +383,8 @@ class SwiGLU(_ActivationOperation):
 
     The Sigmoid Linear Unit (SiLU) gating function is also known as
     the swish function. See
-    `GLU Variants Improve Transformer<https://arxiv.org/abs/2002.05202>`__
-    and `Gaussian Error Linear Units (GELUs)<https://arxiv.org/abs/1606.08415>`__.
+    `GLU Variants Improve Transformer <https://arxiv.org/abs/2002.05202>`__
+    and `Gaussian Error Linear Units (GELUs) <https://arxiv.org/abs/1606.08415>`__ .
 
     """
 
@@ -397,7 +397,7 @@ def _activation_backward_impl(self, *args, **kwargs) -> torch.Tensor:
 
 class ClampedSwiGLU(_ActivationOperation):
     r"""GPT-OSS
-    Implementation based on `GPT-OSS<https://github.com/openai/gpt-oss/blob/a0a84273e9e0c14a233cb9befdfd159c2bcfa6cd/gpt_oss/torch/model.py#L250>`__.
+    Implementation based on `GPT-OSS <https://github.com/openai/gpt-oss/blob/a0a84273e9e0c14a233cb9befdfd159c2bcfa6cd/gpt_oss/torch/model.py#L250>`__.
 
     This activation has two differences compared to the original SwiGLU
        1. Both gate and pre-activations are clipped based on parameter limit.
diff --git a/transformer_engine/pytorch/ops/basic/add_extra_input.py b/transformer_engine/pytorch/ops/basic/add_extra_input.py
index 1fcfa0466ad..2da77369593 100644
--- a/transformer_engine/pytorch/ops/basic/add_extra_input.py
+++ b/transformer_engine/pytorch/ops/basic/add_extra_input.py
@@ -30,7 +30,7 @@ class AddExtraInput(BasicOperation):
     feature and most users are discouraged from it. In-place operations
     break some autograd assumptions and they can result in subtle, esoteric bugs.
 
-    Compare to `MakeExtraOutput`, which does a similar operation in
+    Compare to ``MakeExtraOutput``, which does a similar operation in
     the backward pass.
 
     """
diff --git a/transformer_engine/pytorch/ops/basic/basic_linear.py b/transformer_engine/pytorch/ops/basic/basic_linear.py
index 9f09e6634be..e5009b9ce90 100644
--- a/transformer_engine/pytorch/ops/basic/basic_linear.py
+++ b/transformer_engine/pytorch/ops/basic/basic_linear.py
@@ -48,8 +48,8 @@ def _wait_async(handle: Optional[Any]) -> None:
 class BasicLinear(BasicOperation):
     """Apply linear transformation: :math:`y = x A^T`
 
-    This is a drop-in replacement for `torch.nn.Linear` with
-    `bias=False`.
+    This is a drop-in replacement for ``torch.nn.Linear`` with
+    ``bias=False``.
 
     Parameters
     ----------
@@ -61,27 +61,27 @@ class BasicLinear(BasicOperation):
         Tensor device
     dtype : torch.dtype, default = default dtype
         Tensor datatype
-    tensor_parallel_mode : {`None`, "column", "row"}, default = `None`
+    tensor_parallel_mode : {None, "column", "row"}, default = None
         Mode for tensor parallelism
     tensor_parallel_group : torch.distributed.ProcessGroup, default = world group
         Process group for tensor parallelism
-    sequence_parallel : bool, default = `False`
+    sequence_parallel : bool, default = False
         Whether to apply sequence parallelism together with tensor
         parallelism, i.e. distributing input or output tensors along
         outer dimension (sequence or batch dim) when not distributing
         along inner dimension (embedding dim)
     rng_state_tracker_function : callable
-        Function that returns `CudaRNGStatesTracker`, which is used
+        Function that returns ``CudaRNGStatesTracker``, which is used
         for model-parallel weight initialization
-    accumulate_into_main_grad : bool, default = `False`
+    accumulate_into_main_grad : bool, default = False
         Whether to directly accumulate weight gradients into the
-        weight's `main_grad` attribute instead of relying on PyTorch
-        autograd. The weight's `main_grad` must be set externally and
-        there is no guarantee that `grad` will be set or be
+        weight's ``main_grad`` attribute instead of relying on PyTorch
+        autograd. The weight's ``main_grad`` must be set externally
+        and there is no guarantee that ``grad`` will be set or be
         meaningful. This is primarily intented to integrate with
         Megatron-LM. This argument along with weight tensor having
-        attribute 'overwrite_main_grad' set to True will overwrite
-        `main_grad` instead of accumulating.
+        attribute ``overwrite_main_grad`` set to ``True`` will
+        overwrite ``main_grad`` instead of accumulating.
     userbuffers_options, dict, optional
         Options for overlapping tensor-parallel communication with
         compute using Userbuffers. This feature is highly
@@ -184,7 +184,7 @@ def _canonicalize_tensor_parallelism(
 
         Parameters
         ----------
-        mode: {`None`, "column", "row"}
+        mode: {None, "column", "row"}
             Mode for tensor parallelism
         process_group: torch.distributed.ProcessGroup
             Process group for tensor parallelism
@@ -200,7 +200,7 @@ def _canonicalize_tensor_parallelism(
 
         Returns
         -------
-        mode: {`None`, "column", "row"}
+        mode: {None, "column", "row"}
             Mode for tensor parallelism
         process_group: torch.distributed.ProcessGroup
             Process group for tensor parallelism
@@ -440,18 +440,18 @@ def _functional_forward(
             Output tensor
         beta: float, optional
             Scaling factor applied to original value of out when accumulating into it
-        accumulate_into_out: bool, default = `False`
+        accumulate_into_out: bool, default = False
             Add result to output tensor instead of overwriting
-        tensor_parallel_mode: {`None`, "column", "row"}, default = `None`
+        tensor_parallel_mode: {None, "column", "row"}, default = None
             Mode for tensor parallelism
         tensor_parallel_group: torch.distributed.ProcessGroup, default = world group
             Process group for tensor parallelism
-        sequence_parallel: bool, default = `False`
+        sequence_parallel: bool, default = False
             Whether to apply sequence parallelism together with tensor
             parallelism, i.e. distributing input or output tensors
             along outer dimension (sequence or batch dim) when not
             distributing along inner dimension (embedding dim)
-        with_quantized_compute: bool, default = `False`
+        with_quantized_compute: bool, default = False
             Whether to perform compute with quantized data.
         input_quantizer: Quantizer, optional
             Builder class for quantized input tensor.
@@ -459,10 +459,10 @@ def _functional_forward(
             Builder class for quantized weight tensor.
         output_quantizer: Quantizer, optional
             Builder class for quantized output tensor.
-        input_requires_grad: bool, default = `True`
+        input_requires_grad: bool, default = True
             Whether the loss gradient w.r.t. the input tensor is
             required in the backward pass.
-        weight_requires_grad: bool, default = `True`
+        weight_requires_grad: bool, default = True
             Whether the loss gradient w.r.t. the weight tensor is
             required in the backward pass.
 
@@ -471,11 +471,11 @@ def _functional_forward(
         torch.Tensor
             Output tensor
         torch.Tensor, optional
-            Input tensor, ready for use in backward pass. `None` is
+            Input tensor, ready for use in backward pass. ``None`` is
             returned if loss gradient w.r.t. the weight tensor is not
             required.
         torch.Tensor, optional
-            Weight tensor, ready for use in backward pass. `None` is
+            Weight tensor, ready for use in backward pass. ``None`` is
             returned if loss gradient w.r.t. the input tensor is not
             required.
 
@@ -676,24 +676,24 @@ def _functional_backward(
             Loss gradient w.r.t. weight tensor
         grad_weight_beta: float, optional
             Scaling factor applied to original value of grad_weight when accumulating into it
-        accumulate_into_grad_weight: bool, default = `False`
+        accumulate_into_grad_weight: bool, default = False
             Add result to weight grad instead of overwriting
         grad_input: torch.Tensor, optional
             Loss gradient w.r.t. input tensor
         grad_input_beta: float, optional
             Scaling factor applied to original value of grad_input when accumulating into it
-        accumulate_into_grad_input: bool, default = `False`
+        accumulate_into_grad_input: bool, default = False
             Add result to input grad instead of overwriting
-        tensor_parallel_mode: {`None`, "column", "row"}, default = `None`
+        tensor_parallel_mode: {None, "column", "row"}, default = None
             Mode for tensor parallelism
         tensor_parallel_group: torch.distributed.ProcessGroup, default = world group
             Process group for tensor parallelism
-        sequence_parallel: bool, default = `False`
+        sequence_parallel: bool, default = False
             Whether to apply sequence parallelism together with tensor
             parallelism, i.e. distributing input or output tensors
             along outer dimension (sequence or batch dim) when not
             distributing along inner dimension (embedding dim)
-        with_quantized_compute: bool, default = `False`
+        with_quantized_compute: bool, default = False
             Whether to perform compute with quantized data.
         input_quantizer: Quantizer, optional
             Builder class for quantized input tensor.
diff --git a/transformer_engine/pytorch/ops/basic/bias.py b/transformer_engine/pytorch/ops/basic/bias.py
index 69101638253..6c3c0538c11 100644
--- a/transformer_engine/pytorch/ops/basic/bias.py
+++ b/transformer_engine/pytorch/ops/basic/bias.py
@@ -18,7 +18,7 @@
 class Bias(BasicOperation):
     """Apply additive bias
 
-    This is equivalent to the additive bias in `torch.nn.Linear`.
+    This is equivalent to the additive bias in ``torch.nn.Linear``.
 
     Parameters
     ----------
@@ -28,7 +28,7 @@ class Bias(BasicOperation):
         Tensor device
     dtype : torch.dtype, default = default dtype
         Tensor datatype
-    tensor_parallel : bool, default = `False`
+    tensor_parallel : bool, default = False
         Whether to distribute input tensor and bias tensors along
         inner dimension
     tensor_parallel_group : torch.distributed.ProcessGroup, default = world group
diff --git a/transformer_engine/pytorch/ops/basic/layer_norm.py b/transformer_engine/pytorch/ops/basic/layer_norm.py
index 3922f85cad4..45aed4f4cf4 100644
--- a/transformer_engine/pytorch/ops/basic/layer_norm.py
+++ b/transformer_engine/pytorch/ops/basic/layer_norm.py
@@ -31,7 +31,7 @@ class LayerNorm(BasicOperation):
     r"""Layer Normalization
 
     Applies Layer Normalization over a mini-batch of inputs as described in
-    the paper `Layer Normalization <https://arxiv.org/abs/1607.06450>`__
+    the paper `Layer Normalization <https://arxiv.org/abs/1607.06450>`__ .
 
     .. math::
         y = \frac{x - \mathrm{E}[x]}{\sqrt{\mathrm{Var}[x] + \varepsilon}} * \gamma + \beta
@@ -51,9 +51,9 @@ class LayerNorm(BasicOperation):
         Tensor device
     dtype : torch.dtype, default = default dtype
         Tensor datatype
-    zero_centered_gamma : bool, default = 'False'
-        If `True`, the :math:`\gamma` parameter is initialized to zero
-        and the calculation changes to
+    zero_centered_gamma : bool, default = False
+        If ``True``, the :math:`\gamma` parameter is initialized to
+        zero and the calculation changes to
 
             .. math::
                 y = \frac{x - \mathrm{E}[x]}{\sqrt{\mathrm{Var}[x] + \varepsilon}} * (1 + \gamma) + \beta
diff --git a/transformer_engine/pytorch/ops/basic/make_extra_output.py b/transformer_engine/pytorch/ops/basic/make_extra_output.py
index 34228affc75..7272ebc1894 100644
--- a/transformer_engine/pytorch/ops/basic/make_extra_output.py
+++ b/transformer_engine/pytorch/ops/basic/make_extra_output.py
@@ -35,7 +35,7 @@ class MakeExtraOutput(BasicOperation):
     operations break some autograd assumptions and they can result
     in subtle, esoteric bugs.
 
-    Compare to `AddExtraInput`, which does a similar operation in the
+    Compare to ``AddExtraInput``, which does a similar operation in the
     backward pass.
 
     """
diff --git a/transformer_engine/pytorch/ops/basic/quantize.py b/transformer_engine/pytorch/ops/basic/quantize.py
index 1278701a9bb..c2c46e40199 100644
--- a/transformer_engine/pytorch/ops/basic/quantize.py
+++ b/transformer_engine/pytorch/ops/basic/quantize.py
@@ -18,14 +18,14 @@
 class Quantize(BasicOperation):
     """Quantize tensor data
 
-    Uses recipe from `autocast` context. When called outside
-    of an `autocast` context, this is an identity operation.
+    Uses recipe from ``autocast`` context. When called outside
+    of an ``autocast`` context, this is an identity operation.
 
     Parameters
     ----------
-    forward : bool, default = `True`
+    forward : bool, default = True
         Perform quantization in forward pass
-    backward : bool, default = `False`
+    backward : bool, default = False
         Perform quantization in backward pass
 
     """
diff --git a/transformer_engine/pytorch/ops/basic/reshape.py b/transformer_engine/pytorch/ops/basic/reshape.py
index fcdb3b0bbec..ee8cf4464af 100644
--- a/transformer_engine/pytorch/ops/basic/reshape.py
+++ b/transformer_engine/pytorch/ops/basic/reshape.py
@@ -20,7 +20,7 @@
 class Reshape(BasicOperation):
     """Reshape tensor
 
-    See `torch.reshape`.
+    See ``torch.reshape``.
 
     Parameters
     ----------
diff --git a/transformer_engine/pytorch/ops/basic/rmsnorm.py b/transformer_engine/pytorch/ops/basic/rmsnorm.py
index 316c292c537..59a52183858 100644
--- a/transformer_engine/pytorch/ops/basic/rmsnorm.py
+++ b/transformer_engine/pytorch/ops/basic/rmsnorm.py
@@ -32,7 +32,7 @@ class RMSNorm(BasicOperation):
 
     Applies Root Mean Square Layer Normalization over a mini-batch of
     inputs as described in the paper
-    `Root Mean Square Layer Normalization <https://arxiv.org/abs/1910.07467>`__
+    `Root Mean Square Layer Normalization <https://arxiv.org/abs/1910.07467>`__ .
 
     .. math::
         y = \frac{x}{\sqrt{\mathrm{Var}[x] + \varepsilon}} * \gamma
@@ -50,8 +50,8 @@ class RMSNorm(BasicOperation):
         Tensor device
     dtype : torch.dtype, default = default dtype
         Tensor datatype
-    zero_centered_gamma : bool, default = 'False'
-        If `True`, the :math:`\gamma` parameter is initialized to zero
+    zero_centered_gamma : bool, default = False
+        If ``True``, the :math:`\gamma` parameter is initialized to zero
         and the calculation changes to
 
             .. math::
diff --git a/transformer_engine/pytorch/ops/fused/userbuffers_backward_linear.py b/transformer_engine/pytorch/ops/fused/userbuffers_backward_linear.py
index 5149aa1ffb3..0d2fae2048e 100644
--- a/transformer_engine/pytorch/ops/fused/userbuffers_backward_linear.py
+++ b/transformer_engine/pytorch/ops/fused/userbuffers_backward_linear.py
@@ -125,18 +125,18 @@ def _functional_backward(
             Tensor datatype
         grad_weight: torch.Tensor, optional
             Loss gradient w.r.t. weight tensor
-        accumulate_into_grad_weight: bool, default = `False`
+        accumulate_into_grad_weight: bool, default = False
             Add result to weight grad instead of overwriting
-        tensor_parallel_mode: {`None`, "column", "row"}, default = `None`
+        tensor_parallel_mode: {None, "column", "row"}, default = None
             Mode for tensor parallelism
         tensor_parallel_group: torch.distributed.ProcessGroup, default = world group
             Process group for tensor parallelism
-        sequence_parallel: bool, default = `False`
+        sequence_parallel: bool, default = False
             Whether to apply sequence parallelism together with tensor
             parallelism, i.e. distributing input or output tensors
             along outer dimension (sequence or batch dim) when not
             distributing along inner dimension (embedding dim)
-        with_quantized_compute: bool, default = `False`
+        with_quantized_compute: bool, default = False
             Whether to perform compute with quantized data.
         input_quantizer: Quantizer, optional
             Builder class for quantized input tensor.
diff --git a/transformer_engine/pytorch/ops/fused/userbuffers_forward_linear.py b/transformer_engine/pytorch/ops/fused/userbuffers_forward_linear.py
index 517632d6514..fbcfd4b46af 100644
--- a/transformer_engine/pytorch/ops/fused/userbuffers_forward_linear.py
+++ b/transformer_engine/pytorch/ops/fused/userbuffers_forward_linear.py
@@ -115,16 +115,16 @@ def _functional_forward(
             Tensor device
         dtype: torch.dtype
             Tensor datatype
-        tensor_parallel_mode: {`None`, "column", "row"}, default = `None`
+        tensor_parallel_mode: {None, "column", "row"}, default = None
             Mode for tensor parallelism
         tensor_parallel_group: torch.distributed.ProcessGroup, default = world group
             Process group for tensor parallelism
-        sequence_parallel: bool, default = `False`
+        sequence_parallel: bool, default = False
             Whether to apply sequence parallelism together with tensor
             parallelism, i.e. distributing input or output tensors
             along outer dimension (sequence or batch dim) when not
             distributing along inner dimension (embedding dim)
-        with_quantized_compute: bool, default = `False`
+        with_quantized_compute: bool, default = False
             Whether to perform compute with quantized data.
         input_quantizer: Quantizer, optional
             Builder class for quantized input tensor.
@@ -132,10 +132,10 @@ def _functional_forward(
             Builder class for quantized weight tensor.
         output_quantizer: Quantizer, optional
             Builder class for quantized output tensor.
-        input_requires_grad: bool, default = `True`
+        input_requires_grad: bool, default = True
             Whether the loss gradient w.r.t. the input tensor is
             required in the backward pass.
-        weight_requires_grad: bool, default = `True`
+        weight_requires_grad: bool, default = True
             Whether the loss gradient w.r.t. the weight tensor is
             required in the backward pass.
         ub_comm_name: str
diff --git a/transformer_engine/pytorch/ops/fuser.py b/transformer_engine/pytorch/ops/fuser.py
index fecf28f0a9d..9e865ca42d4 100644
--- a/transformer_engine/pytorch/ops/fuser.py
+++ b/transformer_engine/pytorch/ops/fuser.py
@@ -44,7 +44,7 @@ def _split_tuple(t: tuple, idx: int) -> tuple[tuple, tuple]:
 
 
 def _is_graph_capturing() -> bool:
-    """Whether function is called within `make_graphed_callables`
+    """Whether function is called within ``make_graphed_callables``
 
     Avoid circular import with lazy import.
 
diff --git a/transformer_engine/pytorch/ops/linear.py b/transformer_engine/pytorch/ops/linear.py
index d1e63822911..d28c03f163e 100644
--- a/transformer_engine/pytorch/ops/linear.py
+++ b/transformer_engine/pytorch/ops/linear.py
@@ -23,7 +23,7 @@
 class Linear(FusedOperation):
     """Apply linear transformation: :math:`y = x A^T + b`
 
-    This is a drop-in replacement for `torch.nn.Linear`.
+    This is a drop-in replacement for ``torch.nn.Linear``.
 
     Parameters
     ----------
@@ -31,17 +31,17 @@ class Linear(FusedOperation):
         Inner dimension of input tensor
     out_features : int
         Inner dimension of output tensor
-    bias : bool, default = `True`
+    bias : bool, default = True
         Apply additive bias
     device : torch.device, default = default CUDA device
         Tensor device
     dtype : torch.dtype, default = default dtype
         Tensor datatype
-    tensor_parallel_mode : {`None`, "column", "row"}, default = `None`
+    tensor_parallel_mode : {None, "column", "row"}, default = None
         Mode for tensor parallelism
     tensor_parallel_group : torch.distributed.ProcessGroup, default = world group
         Process group for tensor parallelism
-    sequence_parallel : bool, default = `False`
+    sequence_parallel : bool, default = False
         Whether to apply sequence parallelism together with tensor
         parallelism, i.e. distributing input or output tensors along
         outer dimension (sequence or batch dim) when not distributing
@@ -49,11 +49,11 @@ class Linear(FusedOperation):
     rng_state_tracker_function : callable
         Function that returns CudaRNGStatesTracker, which is used for
         model-parallel weight initialization
-    accumulate_into_main_grad : bool, default = `False`
+    accumulate_into_main_grad : bool, default = False
         Whether to directly accumulate weight gradients into the
-        weight's `main_grad` attribute instead of relying on PyTorch
-        autograd. The weight's `main_grad` must be set externally and
-        there is no guarantee that `grad` will be set or be
+        weight's ``main_grad`` attribute instead of relying on PyTorch
+        autograd. The weight's ``main_grad`` must be set externally and
+        there is no guarantee that ``grad`` will be set or be
         meaningful. This is primarily intented to integrate with
         Megatron-LM.
 
diff --git a/transformer_engine/pytorch/ops/op.py b/transformer_engine/pytorch/ops/op.py
index 421c92b8235..20227c6cf41 100644
--- a/transformer_engine/pytorch/ops/op.py
+++ b/transformer_engine/pytorch/ops/op.py
@@ -94,7 +94,7 @@ def fuser_forward(
         several of this function's arguments are lists of arguments to
         forward functions of corresponding basic ops.
 
-        Called by `OperationFuser`.
+        Called by ``OperationFuser``.
 
         Parameters
         ----------
@@ -141,7 +141,7 @@ def fuser_backward(
         several of this function's arguments are lists of arguments to
         backward functions of corresponding basic ops.
 
-        Called by `OperationFuser`.
+        Called by ``OperationFuser``.
 
         Parameters
         ----------
diff --git a/transformer_engine/pytorch/ops/sequential.py b/transformer_engine/pytorch/ops/sequential.py
index 2afda58e47d..de545419e5b 100644
--- a/transformer_engine/pytorch/ops/sequential.py
+++ b/transformer_engine/pytorch/ops/sequential.py
@@ -15,10 +15,10 @@
 
 
 class Sequential(torch.nn.Module):
-    """Sequential container for fusible operations
+    """Sequential container for fusible operations.
 
-    This is a drop-in replacement for `torch.nn.Sequential`, with
-    support for fusing `FusibleOperation`s.
+    This is a drop-in replacement for ``torch.nn.Sequential`` with
+    support for fusing ``FusibleOperation`` s.
 
     Parameters
     ----------

From ee35af6b3fd5979e2c23b54fbc57dbbb391264a9 Mon Sep 17 00:00:00 2001
From: Tim Moon <tmoon@nvidia.com>
Date: Tue, 2 Dec 2025 22:03:26 -0800
Subject: [PATCH 3/5] Fix error when building docs

Signed-off-by: Tim Moon <tmoon@nvidia.com>
---
 transformer_engine/pytorch/ops/basic/activation.py | 9 +++++++--
 1 file changed, 7 insertions(+), 2 deletions(-)

diff --git a/transformer_engine/pytorch/ops/basic/activation.py b/transformer_engine/pytorch/ops/basic/activation.py
index 229a7661b60..feb57c8eb08 100644
--- a/transformer_engine/pytorch/ops/basic/activation.py
+++ b/transformer_engine/pytorch/ops/basic/activation.py
@@ -403,8 +403,12 @@ class ClampedSwiGLU(_ActivationOperation):
        1. Both gate and pre-activations are clipped based on parameter limit.
        2. Activation uses sigmoid(alpha * x) instead of sigmoid(x) used in Swish activation.
 
-    .. warning::    The input tensor is chunked along the last dimension to get gates/pre-activations which is differnt
-    from GPT OSS implementation where the gates/pre-activations are assumed to be interleaved in the input tensor.
+    .. warning::
+
+       The input tensor is chunked along the last dimension to get
+       gates/pre-activations which is differnt from GPT OSS
+       implementation where the gates/pre-activations are assumed to
+       be interleaved in the input tensor.
 
     Parameters
     ----------
@@ -414,6 +418,7 @@ class ClampedSwiGLU(_ActivationOperation):
         The scaling factor for the sigmoid function used in the activation.
     cache_quantized_input : bool, default = False
         Quantize input tensor when caching for use in the backward pass.
+
     """
 
     def __init__(

From 2a0111b3eef39ec0f2804f96851fbe2f635682b9 Mon Sep 17 00:00:00 2001
From: Tim Moon <4406448+timmoon10@users.noreply.github.com>
Date: Tue, 2 Dec 2025 22:05:28 -0800
Subject: [PATCH 4/5] Fix typo

Review suggestion from @greptile-apps

Co-authored-by: greptile-apps[bot] <165735046+greptile-apps[bot]@users.noreply.github.com>
Signed-off-by: Tim Moon <4406448+timmoon10@users.noreply.github.com>
---
 docs/examples/op_fuser/op_fuser.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/examples/op_fuser/op_fuser.rst b/docs/examples/op_fuser/op_fuser.rst
index 9b4dce2acff..c57f95169be 100644
--- a/docs/examples/op_fuser/op_fuser.rst
+++ b/docs/examples/op_fuser/op_fuser.rst
@@ -184,7 +184,7 @@ arguments and the extra outputs will be returned.
     # Forward pass
     x = torch.randn(16384, 4096, device="cuda")
     y, residual = fc1(x)
-    y = fc2(x, residual)
+    y = fc2(y, residual)
 
 .. figure:: ./residual_layernorm_mlp.png
    :align: center

From 5102852ec83523e4219bde1f83025df2e7589ce5 Mon Sep 17 00:00:00 2001
From: Tim Moon <4406448+timmoon10@users.noreply.github.com>
Date: Tue, 2 Dec 2025 22:13:23 -0800
Subject: [PATCH 5/5] Fix swapped args to `te.ops.Linear`

Co-authored-by: greptile-apps[bot] <165735046+greptile-apps[bot]@users.noreply.github.com>
Signed-off-by: Tim Moon <4406448+timmoon10@users.noreply.github.com>
---
 docs/examples/op_fuser/op_fuser.rst | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/docs/examples/op_fuser/op_fuser.rst b/docs/examples/op_fuser/op_fuser.rst
index c57f95169be..18cae65a720 100644
--- a/docs/examples/op_fuser/op_fuser.rst
+++ b/docs/examples/op_fuser/op_fuser.rst
@@ -66,9 +66,9 @@ Thus, using the operation fuser simply involves constructing
     # Construct operations and fuse
     mlp = te.ops.Sequential(
         te.ops.LayerNorm(hidden_size),
-        te.ops.Linear(ffn_size, hidden_size),
+        te.ops.Linear(hidden_size, ffn_size),
         te.ops.SwiGLU(),
-        te.ops.Linear(hidden_size, ffn_size // 2),
+        te.ops.Linear(ffn_size // 2, hidden_size),
     )
 
     # Forward pass
@@ -99,7 +99,7 @@ quantized compute.
     with te.quantized_model_init():
         fc1 = te.ops.Sequential(
             te.ops.LayerNorm(4096),
-            te.ops.Linear(28672, 4096),
+            te.ops.Linear(4096, 28672),
         )
 
     # Forward pass within autocast context
@@ -137,7 +137,7 @@ adding ``Quantize`` operations.
             te.ops.Quantize(),
         )
         fc1 = te.ops.Sequential(
-            te.ops.Linear(28672, 4096),
+            te.ops.Linear(4096, 28672),
         )
 
     # Forward pass
@@ -173,11 +173,11 @@ arguments and the extra outputs will be returned.
     fc1 = te.ops.Sequential(
         te.ops.LayerNorm(4096),
         te.ops.MakeExtraOutput(),  # Output residual
-        te.ops.Linear(28672, 4096),
+        te.ops.Linear(4096, 28672),
         te.ops.SwiGLU(),
     )
     fc2 = te.ops.Sequential(
-        te.ops.Linear(4096, 14336),
+        te.ops.Linear(14336, 4096),
         te.ops.AddExtraInput(),  # Add residual
     )