chiark / gitweb /
wip
[talk-2019-ghm-rust.git] / talk.txt
1
2 [ intro slide - my language background ]
3
4 Hi.  This talk is going to be, mostly, a plug for Rust.
5
6 Those of you who know me may find this surprising.  After all Rust in
7 its current form is only about 4 years old, and I myself only learned
8 it in December.  I'm not known for liking new things :-).  All I can
9 say is that I tried it and have been impressed.
10
11 In most respects Rust is a competent but not particularly novel
12 language.  It has one novel feature, but the rest feels like a
13 collation of good and established features from other competent
14 languages.
15
16 Rust is most often seen as a competitor to C and C++.  That's fair as
17 far as it goes: certainly there are few reasons to use C or C++ over
18 Rust for an entirely new project.  But for me, Rust's power and
19 flexibility mean its appeal is much wider than that.
20
21 B======================================================================B
22
23 [ MM survey slide ]
24
25 Firstly, I'm going to go into some detail about Rust's one very novel
26 property: it's approach to memory management.  Let us consider,
27 particularly, dynamically allocated memory.
28
29 Until now there have been basically two approaches:
30
31 In lower-level languages like C, C++ and assembler, you as the
32 programmer must know whenever memory allocation is occurring, and
33 control when that memory is freed, usually with explicit code.
34 Mistakes lead to bugs - often, bugs which are very hard to track down.
35 There are some static checkers, and coding conventions, which help to
36 reduce the number of these bugs but they are still a big problem even
37 with the most careful software development practices.
38
39 In higher-level languages, memory allocation is often implicit and
40 deallocation is handled automatically by a garbage collector.  This is
41 convenient for the programmer.  But it requires support from a
42 language runtime, which is awkward in some environments and makes it
43 hard to interface to other languages.  And it costs performance -
44 sometimes, a lot of performance.  Traditionally, garbage-collected
45 languages have focused on programmer convenience, or programming
46 language power, rather than performance.
47
48 [ MM survey slide + Rust ]
49
50 Rust has a different approach.  Each object in a Rust program has
51 exactly one owner; for a local variable that owner is the variable.
52 For an object in a complex data structure, the data structure is the
53 owner (and of course that data structure has, in turn, an owner).  In
54 many ways this resembles informal notions of object ownership which
55 programmers have typically used in C and C++ to make their code
56 comprehensible.
57
58 But in Rust the ownership is known to the language, and the rules
59 surrounding ownership are enforced by the compiler.  When an object
60 ceases to have an owner, it is freed.
61
62 This ownership system is used not only for dynamically allocated
63 objects, but for local variables, and statically allocated objects.
64
65 [ Borrowing example slide ]  https://doc.rust-lang.org/book/ch04-02-references-and-borrowing.html#mutable-references
66
67 To allow an object to be accessed other than through owner, Rust
68 formalises the notion of borrowing.  An object can be borrowed by
69 writing the ampersand, giving a reference.  The compiler checks that
70 the object will outlive the reference.
71
72 [ dangling reference error example  https://doc.rust-lang.org/book/ch04-02-references-and-borrowing.html#dangling-references ]
73
74 Borrows (that is, references) come in two kinds: mutable and
75 immutable.  You can have many immutable references at once.  A mutable
76 reference permits modification, and provides exclusive access.
77
78 [ Borrowing example slide with mut missing ]  ABOVE https://doc.rust-lang.org/book/ch04-02-references-and-borrowing.html#mutable-references
79
80 That's what the `mut' is doing in that example.  If you leave it out
81 the compiler complains.  This is the Rust `borrow checker' that you
82 have may have heard about: the part of the compiler which enforces the
83 object ownership rules.
84
85 Overall, this scheme makes use-after-free and double-free bugs
86 impossible.  You have to work at it to make a memory leak.  Rust
87 programs are safe (by default): you can write bugs, but you cannot
88 randomly corrupt memory (or otherwise trigger what in C/C++ is called
89 "undefined behaviour").  The ownership rules even give you safe
90 multithreading.
91
92 And, the ownership system means that the compiler can often optimise
93 very aggressively, because it has really good visibility of all the
94 aliases of and references to the objects its working with.  Compared
95 to garbage collected languages, the ownership system eliminates a lot
96 of runtime memory management.  I have found Rust programs to generally
97 be very fast.
98
99 C======================================================================C
100
101 [ overview slide? | syntax ]
102
103 Apart from the ownership system, there is little new in Rust.
104 Nevertheless, it is an advanced language with a lot of expressive
105 power - power which is generally available without sacrificing
106 performance.
107
108 Sometimes advanced languages from academia can feel like
109 incomprehensible alien technology, with a steep learning curve and an
110 unfamiliar or even obscure syntax.
111
112 Not Rust.  For me, Rust has managed to take the best and most proven
113 features of earlier research languages, and package them up into a
114 whole which feels fairly familiar and is easy to use.
115
116 I'm going to zoom through a few of Rust's most important properties:
117
118 [ syntax | safety ]
119
120 Rust's syntax is a conventional structure of curly braces, keywords,
121 parentheses, and infix expressions.  It looks a lot like C or
122 JavaScript or something.
123
124 [ safety | type ]
125
126 Rust is safe by default.  That is, bugs in your code can't corrupt
127 memory the way that they do in C and C++.  But, unlike most other safe
128 languages, if you really want full manual control, you can write
129 `unsafe'.  This is rarely needed, even if you want really fast code.
130
131 [ type | inference ]
132
133 Rust is statically typed.  The compiler will typecheck it.  This is
134 great.  You may have heard Haskell and Ocaml programmers say "once you
135 can get the program to typecheck, it will probably work".  Rust has
136 the same experience.  When in the throes of writing a complex
137 algorithm you can type some drivelous pseudocode into your text
138 editor.  Then keep fixing errors until it builds and lo! it will often
139 work.
140
141 Rust also has type inference (similar to Ocaml, Haskell, etc.), so you
142 can often leave out the type annotations.
143
144 [ polymorphism ]
145
146 Rust supports polymorphism (also known as `generics'; it calls the
147 feature `traits'.  They're a bit bit like C++ templates, but not mad.
148 Rust supports dynamic dispatch (like `virtual' in C++), or static
149 dispatch, but in both cases the typechecking is done at compile time.
150
151 [ unsafe Rust/C/C++ example, chrobakpayne.rs glue.cpp ]
152
153 Rust has a reasonably good system for interfacing to code written in
154 other languages.  With the appropriate annotations, you can call C
155 functions directly from Rust and vice versa.  (Of course this requires
156 you to say `unsafe', since the semantics of the C parts of the program
157 are not known to the Rust compiler so you must check them yourself.)
158 Built on top of that are machineries for glueing Rust to, for example,
159 Python.
160
161 D======================================================================D
162
163 I also want to talk a bit about the attitudes and values of the Rust
164 project.  (I should say that this is an outsider's point of view.)
165
166 [ slide with quotes from C vs Rust ]
167
168 The most impressive thing, for me, is that the Rust community does not
169 blame Rust programmers for the bugs in Rust programs.  Rather, they
170 look for opportunities to help the programmer avoid bugs.  There is a
171 clear design ethos, to make APIs where the default and easy option
172 does the right thing, and to avoid beartraps.
173
174 In particular, the comparison with C is very striking.  The C
175 community have even resorted to writing compilers which ferociously
176 analyse your program for violations of C's bizarre and
177 nigh-incomprehensible rules, and then use those rule breaches as
178 excuses to miscompile your program.
179
180 Convenience is not regarded as the enemy of correctness, but its ally.
181
182 [ slide with interface stability ]
183
184 Since declaring 1.0 in 2015, the Rust project has been quite careful
185 about language and library stability.  They make a clear distinction
186 between stable and unstable features, and try quite hard to avoid
187 backward-incompatible changes to anything which has been declared as
188 stable.
189
190 [ slide with error message ]
191
192 The Rust compiler's error messages are truly outstanding.  They are
193 brief enough to be comprehensible, but contain enough information to
194 know precisely what is wrong.  They even usually come with a
195 suggestion from the compiler about what to do about it - suggestions
196 which are right about half the time.
197
198 [ process and code of conduct ]
199
200 There's a mature process for evaluating and deciding on new features,
201 and a modern Code of Conduct.
202
203 E======================================================================E
204
205 Of course nothing is perfect.  I'm very critical by nature, so I often
206 find things to gripe about.
207
208 [ borrow checker error, lifetime example ]
209
210 The most obvious difficulty with Rust, if you read the internet, is
211 some's feeling they are constantly fighting the borrow checker.
212 Personally I have not found this to be a problem at all.  I think it
213 may depend on how much experience of informal object ownership systems
214 you have - in particular, how much C and C++ you've done.
215
216 Of course having something like the borrow checker is the price Rust
217 pays for its novel memory management strategy, and it is that novel
218 strategy that makes for the high performance of Rust programs.
219
220 There is one annoyance that occurs when trying to design and implement
221 complex APIs.  It is not straightforward to define an object type one
222 of whose members is (or contains) a reference to another member.
223 Luckily this doesn't come up very often, and it is still possible to
224 hide the issue from the API's consumer.  The awkwardness is tolerable.
225
226 [ serde | macro_rules! ]
227
228 Rust does have macros.  In fact it has two ways to define macros (one
229 built on top of the other).  The more sophisticated macro system is
230 very capable and has been used to really impressive effect.  You can
231 see an example here.
232
233 But it's hard to use casually; and the simpler macro definition
234 facility is simultaneously too complicated and underpowered.  So
235 casual macro use is slightly awkward.
236
237 [ cargo - dw posts, links ]
238
239 But the worst problem is cargo.  Cargo is Rust's language-specific
240 package manager and build tool.  It is really quite annoying.
241
242 The worst problem is that like all modern tools of this kind, its main
243 purpose is to automatically download stuff from the internet and run
244 it.  Apparently this is what is expected by the youth of today.  It
245 can be hit hard enough to stop it doing this, but you still run into
246 the difficulty that if you use one library from the repository, you
247 end up having to trust much more widely than ideal.  And at least
248 Rust's repository contains larger libraries than, say node.js's, so
249 the number of people you're trusting is much lower.
250
251 Also, as a build tool, cargo can be very inflexible.  Despite an
252 official policy that cargo should be suitable for running inside
253 another build systme, requests to be able to do `weird stuff' seem
254 usually to result in excuses why the thing you want to do is a bad
255 idea, rather than useful increases in flexibility.  (And the excuses
256 are usually based on misunderstandings.)  I guess if your project ends
257 up containing piece of opinionated curl-pipe-bash-ware, you should
258 expect a culture which produces these kind of problems.
259
260 F======================================================================~
261
262 [ rust-lang, ian.jackson@ ]
263
264 Despite these difficulties, and of course a fair few minor
265 irritations, I have found programming in Rust to be both fun and very
266 productive.
267
268 I'm a very polylingual programmer.  I think my record is 6 languages
269 in the same personal project.  Some of my recent forays into Rust have
270 involved switching between Rust and C++ and Perl.  This kind of thing
271 throws differences between languages into sharp relief.
272
273 Rust is now my language of choice for many nontrivial programs.
274 Certainly I would try to avoid starting a new program in C or C++.
275
276 Rust's compile-time type checking and its performance can make it an
277 attractive alternative to scripting languages like Python, Perl and
278 Tcl.  Its macro system, and consistent high performance, can make it
279 an attractive alternative to Haskell or Ocaml.
280
281 I'll still start new programs in many of those other languages, and
282 often I choose a language for its libraries.  But for me Rust will
283 now often be my preferred choice, if I can get away with it.
284
285 If you want to know more, there's a wealth of stuff online.  The place
286 to start is probably https://docs.rust-lang.org/.  And of course I'd
287 be happy to help.