17310403eSTomasz Miąsko //===--- RustDemangle.cpp ---------------------------------------*- C++ -*-===//
27310403eSTomasz Miąsko //
37310403eSTomasz Miąsko // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
47310403eSTomasz Miąsko // See https://llvm.org/LICENSE.txt for license information.
57310403eSTomasz Miąsko // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
67310403eSTomasz Miąsko //
77310403eSTomasz Miąsko //===----------------------------------------------------------------------===//
87310403eSTomasz Miąsko //
97310403eSTomasz Miąsko // This file defines a demangler for Rust v0 mangled symbols as specified in
107310403eSTomasz Miąsko // https://rust-lang.github.io/rfcs/2603-rust-symbol-name-mangling-v0.html
117310403eSTomasz Miąsko //
127310403eSTomasz Miąsko //===----------------------------------------------------------------------===//
137310403eSTomasz Miąsko 
147310403eSTomasz Miąsko #include "llvm/Demangle/RustDemangle.h"
157310403eSTomasz Miąsko #include "llvm/Demangle/Demangle.h"
167310403eSTomasz Miąsko 
177310403eSTomasz Miąsko #include <algorithm>
187310403eSTomasz Miąsko #include <cassert>
197310403eSTomasz Miąsko #include <cstring>
207310403eSTomasz Miąsko #include <limits>
217310403eSTomasz Miąsko 
227310403eSTomasz Miąsko using namespace llvm;
237310403eSTomasz Miąsko using namespace rust_demangle;
247310403eSTomasz Miąsko 
257310403eSTomasz Miąsko char *llvm::rustDemangle(const char *MangledName, char *Buf, size_t *N,
267310403eSTomasz Miąsko                          int *Status) {
277310403eSTomasz Miąsko   if (MangledName == nullptr || (Buf != nullptr && N == nullptr)) {
287310403eSTomasz Miąsko     if (Status != nullptr)
297310403eSTomasz Miąsko       *Status = demangle_invalid_args;
307310403eSTomasz Miąsko     return nullptr;
317310403eSTomasz Miąsko   }
327310403eSTomasz Miąsko 
337310403eSTomasz Miąsko   // Return early if mangled name doesn't look like a Rust symbol.
347310403eSTomasz Miąsko   StringView Mangled(MangledName);
357310403eSTomasz Miąsko   if (!Mangled.startsWith("_R")) {
367310403eSTomasz Miąsko     if (Status != nullptr)
377310403eSTomasz Miąsko       *Status = demangle_invalid_mangled_name;
387310403eSTomasz Miąsko     return nullptr;
397310403eSTomasz Miąsko   }
407310403eSTomasz Miąsko 
417310403eSTomasz Miąsko   Demangler D;
427310403eSTomasz Miąsko   if (!initializeOutputStream(nullptr, nullptr, D.Output, 1024)) {
437310403eSTomasz Miąsko     if (Status != nullptr)
447310403eSTomasz Miąsko       *Status = demangle_memory_alloc_failure;
457310403eSTomasz Miąsko     return nullptr;
467310403eSTomasz Miąsko   }
477310403eSTomasz Miąsko 
487310403eSTomasz Miąsko   if (!D.demangle(Mangled)) {
497310403eSTomasz Miąsko     if (Status != nullptr)
507310403eSTomasz Miąsko       *Status = demangle_invalid_mangled_name;
517310403eSTomasz Miąsko     std::free(D.Output.getBuffer());
527310403eSTomasz Miąsko     return nullptr;
537310403eSTomasz Miąsko   }
547310403eSTomasz Miąsko 
557310403eSTomasz Miąsko   D.Output += '\0';
567310403eSTomasz Miąsko   char *Demangled = D.Output.getBuffer();
577310403eSTomasz Miąsko   size_t DemangledLen = D.Output.getCurrentPosition();
587310403eSTomasz Miąsko 
597310403eSTomasz Miąsko   if (Buf != nullptr) {
607310403eSTomasz Miąsko     if (DemangledLen <= *N) {
617310403eSTomasz Miąsko       std::memcpy(Buf, Demangled, DemangledLen);
627310403eSTomasz Miąsko       std::free(Demangled);
637310403eSTomasz Miąsko       Demangled = Buf;
647310403eSTomasz Miąsko     } else {
657310403eSTomasz Miąsko       std::free(Buf);
667310403eSTomasz Miąsko     }
677310403eSTomasz Miąsko   }
687310403eSTomasz Miąsko 
697310403eSTomasz Miąsko   if (N != nullptr)
707310403eSTomasz Miąsko     *N = DemangledLen;
717310403eSTomasz Miąsko 
727310403eSTomasz Miąsko   if (Status != nullptr)
737310403eSTomasz Miąsko     *Status = demangle_success;
747310403eSTomasz Miąsko 
757310403eSTomasz Miąsko   return Demangled;
767310403eSTomasz Miąsko }
777310403eSTomasz Miąsko 
787310403eSTomasz Miąsko Demangler::Demangler(size_t MaxRecursionLevel)
797310403eSTomasz Miąsko     : MaxRecursionLevel(MaxRecursionLevel) {}
807310403eSTomasz Miąsko 
817310403eSTomasz Miąsko static inline bool isDigit(const char C) { return '0' <= C && C <= '9'; }
827310403eSTomasz Miąsko 
83cd74dd17STomasz Miąsko static inline bool isHexDigit(const char C) {
84cd74dd17STomasz Miąsko   return ('0' <= C && C <= '9') || ('a' <= C && C <= 'f');
85cd74dd17STomasz Miąsko }
86cd74dd17STomasz Miąsko 
877310403eSTomasz Miąsko static inline bool isLower(const char C) { return 'a' <= C && C <= 'z'; }
887310403eSTomasz Miąsko 
897310403eSTomasz Miąsko static inline bool isUpper(const char C) { return 'A' <= C && C <= 'Z'; }
907310403eSTomasz Miąsko 
917310403eSTomasz Miąsko /// Returns true if C is a valid mangled character: <0-9a-zA-Z_>.
927310403eSTomasz Miąsko static inline bool isValid(const char C) {
937310403eSTomasz Miąsko   return isDigit(C) || isLower(C) || isUpper(C) || C == '_';
947310403eSTomasz Miąsko }
957310403eSTomasz Miąsko 
967310403eSTomasz Miąsko // Demangles Rust v0 mangled symbol. Returns true when successful, and false
977310403eSTomasz Miąsko // otherwise. The demangled symbol is stored in Output field. It is
987310403eSTomasz Miąsko // responsibility of the caller to free the memory behind the output stream.
997310403eSTomasz Miąsko //
1007310403eSTomasz Miąsko // <symbol-name> = "_R" <path> [<instantiating-crate>]
1017310403eSTomasz Miąsko bool Demangler::demangle(StringView Mangled) {
1027310403eSTomasz Miąsko   Position = 0;
1037310403eSTomasz Miąsko   Error = false;
104*f0f2a8b2STomasz Miąsko   Print = true;
1057310403eSTomasz Miąsko   RecursionLevel = 0;
1067310403eSTomasz Miąsko 
1077310403eSTomasz Miąsko   if (!Mangled.consumeFront("_R")) {
1087310403eSTomasz Miąsko     Error = true;
1097310403eSTomasz Miąsko     return false;
1107310403eSTomasz Miąsko   }
1117310403eSTomasz Miąsko   Input = Mangled;
1127310403eSTomasz Miąsko 
1137310403eSTomasz Miąsko   demanglePath();
1147310403eSTomasz Miąsko 
1157310403eSTomasz Miąsko   // FIXME parse optional <instantiating-crate>.
1167310403eSTomasz Miąsko 
1177310403eSTomasz Miąsko   if (Position != Input.size())
1187310403eSTomasz Miąsko     Error = true;
1197310403eSTomasz Miąsko 
1207310403eSTomasz Miąsko   return !Error;
1217310403eSTomasz Miąsko }
1227310403eSTomasz Miąsko 
1237310403eSTomasz Miąsko // <path> = "C" <identifier>               // crate root
1247310403eSTomasz Miąsko //        | "M" <impl-path> <type>         // <T> (inherent impl)
1257310403eSTomasz Miąsko //        | "X" <impl-path> <type> <path>  // <T as Trait> (trait impl)
1267310403eSTomasz Miąsko //        | "Y" <type> <path>              // <T as Trait> (trait definition)
1277310403eSTomasz Miąsko //        | "N" <ns> <path> <identifier>   // ...::ident (nested path)
1287310403eSTomasz Miąsko //        | "I" <path> {<generic-arg>} "E" // ...<T, U> (generic args)
1297310403eSTomasz Miąsko //        | <backref>
1307310403eSTomasz Miąsko // <identifier> = [<disambiguator>] <undisambiguated-identifier>
1317310403eSTomasz Miąsko // <ns> = "C"      // closure
1327310403eSTomasz Miąsko //      | "S"      // shim
1337310403eSTomasz Miąsko //      | <A-Z>    // other special namespaces
1347310403eSTomasz Miąsko //      | <a-z>    // internal namespaces
1357310403eSTomasz Miąsko void Demangler::demanglePath() {
1367310403eSTomasz Miąsko   if (Error || RecursionLevel >= MaxRecursionLevel) {
1377310403eSTomasz Miąsko     Error = true;
1387310403eSTomasz Miąsko     return;
1397310403eSTomasz Miąsko   }
14078e94915STomasz Miąsko   SwapAndRestore<size_t> SaveRecursionLevel(RecursionLevel, RecursionLevel + 1);
1417310403eSTomasz Miąsko 
1427310403eSTomasz Miąsko   switch (consume()) {
1437310403eSTomasz Miąsko   case 'C': {
1447310403eSTomasz Miąsko     parseOptionalBase62Number('s');
1457310403eSTomasz Miąsko     Identifier Ident = parseIdentifier();
1467310403eSTomasz Miąsko     print(Ident.Name);
1477310403eSTomasz Miąsko     break;
1487310403eSTomasz Miąsko   }
149*f0f2a8b2STomasz Miąsko   case 'M': {
150*f0f2a8b2STomasz Miąsko     demangleImplPath();
151*f0f2a8b2STomasz Miąsko     print("<");
152*f0f2a8b2STomasz Miąsko     demangleType();
153*f0f2a8b2STomasz Miąsko     print(">");
154*f0f2a8b2STomasz Miąsko     break;
155*f0f2a8b2STomasz Miąsko   }
1567310403eSTomasz Miąsko   case 'N': {
1577310403eSTomasz Miąsko     char NS = consume();
1587310403eSTomasz Miąsko     if (!isLower(NS) && !isUpper(NS)) {
1597310403eSTomasz Miąsko       Error = true;
1607310403eSTomasz Miąsko       break;
1617310403eSTomasz Miąsko     }
1627310403eSTomasz Miąsko     demanglePath();
1637310403eSTomasz Miąsko 
16478e94915STomasz Miąsko     uint64_t Disambiguator = parseOptionalBase62Number('s');
1657310403eSTomasz Miąsko     Identifier Ident = parseIdentifier();
1667310403eSTomasz Miąsko 
16778e94915STomasz Miąsko     if (isUpper(NS)) {
16878e94915STomasz Miąsko       // Special namespaces
16978e94915STomasz Miąsko       print("::{");
17078e94915STomasz Miąsko       if (NS == 'C')
17178e94915STomasz Miąsko         print("closure");
17278e94915STomasz Miąsko       else if (NS == 'S')
17378e94915STomasz Miąsko         print("shim");
17478e94915STomasz Miąsko       else
17578e94915STomasz Miąsko         print(NS);
1767310403eSTomasz Miąsko       if (!Ident.empty()) {
17778e94915STomasz Miąsko         print(":");
17878e94915STomasz Miąsko         print(Ident.Name);
17978e94915STomasz Miąsko       }
18078e94915STomasz Miąsko       print('#');
18178e94915STomasz Miąsko       printDecimalNumber(Disambiguator);
18278e94915STomasz Miąsko       print('}');
18378e94915STomasz Miąsko     } else {
18478e94915STomasz Miąsko       // Implementation internal namespaces.
18578e94915STomasz Miąsko       if (!Ident.empty()) {
1867310403eSTomasz Miąsko         print("::");
1877310403eSTomasz Miąsko         print(Ident.Name);
1887310403eSTomasz Miąsko       }
18978e94915STomasz Miąsko     }
1907310403eSTomasz Miąsko     break;
1917310403eSTomasz Miąsko   }
1922961f863STomasz Miąsko   case 'I': {
1932961f863STomasz Miąsko     demanglePath();
1942961f863STomasz Miąsko     print("::<");
1952961f863STomasz Miąsko     for (size_t I = 0; !Error && !consumeIf('E'); ++I) {
1962961f863STomasz Miąsko       if (I > 0)
1972961f863STomasz Miąsko         print(", ");
1982961f863STomasz Miąsko       demangleGenericArg();
1992961f863STomasz Miąsko     }
2002961f863STomasz Miąsko     print(">");
2012961f863STomasz Miąsko     break;
2022961f863STomasz Miąsko   }
2037310403eSTomasz Miąsko   default:
2047310403eSTomasz Miąsko     // FIXME parse remaining productions.
2057310403eSTomasz Miąsko     Error = true;
2067310403eSTomasz Miąsko     break;
2077310403eSTomasz Miąsko   }
2087310403eSTomasz Miąsko }
2097310403eSTomasz Miąsko 
210*f0f2a8b2STomasz Miąsko // <impl-path> = [<disambiguator>] <path>
211*f0f2a8b2STomasz Miąsko // <disambiguator> = "s" <base-62-number>
212*f0f2a8b2STomasz Miąsko void Demangler::demangleImplPath() {
213*f0f2a8b2STomasz Miąsko   SwapAndRestore<bool> SavePrint(Print, false);
214*f0f2a8b2STomasz Miąsko   parseOptionalBase62Number('s');
215*f0f2a8b2STomasz Miąsko   demanglePath();
216*f0f2a8b2STomasz Miąsko }
217*f0f2a8b2STomasz Miąsko 
2182961f863STomasz Miąsko // <generic-arg> = <lifetime>
2192961f863STomasz Miąsko //               | <type>
2202961f863STomasz Miąsko //               | "K" <const>
2212961f863STomasz Miąsko // <lifetime> = "L" <base-62-number>
2222961f863STomasz Miąsko void Demangler::demangleGenericArg() {
223cd74dd17STomasz Miąsko   if (consumeIf('K'))
224cd74dd17STomasz Miąsko     demangleConst();
225cd74dd17STomasz Miąsko   else
2262961f863STomasz Miąsko     demangleType();
227cd74dd17STomasz Miąsko   // FIXME demangle lifetimes.
2282961f863STomasz Miąsko }
2292961f863STomasz Miąsko 
2302961f863STomasz Miąsko // <basic-type> = "a"      // i8
2312961f863STomasz Miąsko //              | "b"      // bool
2322961f863STomasz Miąsko //              | "c"      // char
2332961f863STomasz Miąsko //              | "d"      // f64
2342961f863STomasz Miąsko //              | "e"      // str
2352961f863STomasz Miąsko //              | "f"      // f32
2362961f863STomasz Miąsko //              | "h"      // u8
2372961f863STomasz Miąsko //              | "i"      // isize
2382961f863STomasz Miąsko //              | "j"      // usize
2392961f863STomasz Miąsko //              | "l"      // i32
2402961f863STomasz Miąsko //              | "m"      // u32
2412961f863STomasz Miąsko //              | "n"      // i128
2422961f863STomasz Miąsko //              | "o"      // u128
2432961f863STomasz Miąsko //              | "s"      // i16
2442961f863STomasz Miąsko //              | "t"      // u16
2452961f863STomasz Miąsko //              | "u"      // ()
2462961f863STomasz Miąsko //              | "v"      // ...
2472961f863STomasz Miąsko //              | "x"      // i64
2482961f863STomasz Miąsko //              | "y"      // u64
2492961f863STomasz Miąsko //              | "z"      // !
2502961f863STomasz Miąsko //              | "p"      // placeholder (e.g. for generic params), shown as _
251cd74dd17STomasz Miąsko static bool parseBasicType(char C, BasicType &Type) {
252cd74dd17STomasz Miąsko   switch (C) {
253cd74dd17STomasz Miąsko   case 'a':
254cd74dd17STomasz Miąsko     Type = BasicType::I8;
255cd74dd17STomasz Miąsko     return true;
256cd74dd17STomasz Miąsko   case 'b':
257cd74dd17STomasz Miąsko     Type = BasicType::Bool;
258cd74dd17STomasz Miąsko     return true;
259cd74dd17STomasz Miąsko   case 'c':
260cd74dd17STomasz Miąsko     Type = BasicType::Char;
261cd74dd17STomasz Miąsko     return true;
262cd74dd17STomasz Miąsko   case 'd':
263cd74dd17STomasz Miąsko     Type = BasicType::F64;
264cd74dd17STomasz Miąsko     return true;
265cd74dd17STomasz Miąsko   case 'e':
266cd74dd17STomasz Miąsko     Type = BasicType::Str;
267cd74dd17STomasz Miąsko     return true;
268cd74dd17STomasz Miąsko   case 'f':
269cd74dd17STomasz Miąsko     Type = BasicType::F32;
270cd74dd17STomasz Miąsko     return true;
271cd74dd17STomasz Miąsko   case 'h':
272cd74dd17STomasz Miąsko     Type = BasicType::U8;
273cd74dd17STomasz Miąsko     return true;
274cd74dd17STomasz Miąsko   case 'i':
275cd74dd17STomasz Miąsko     Type = BasicType::ISize;
276cd74dd17STomasz Miąsko     return true;
277cd74dd17STomasz Miąsko   case 'j':
278cd74dd17STomasz Miąsko     Type = BasicType::USize;
279cd74dd17STomasz Miąsko     return true;
280cd74dd17STomasz Miąsko   case 'l':
281cd74dd17STomasz Miąsko     Type = BasicType::I32;
282cd74dd17STomasz Miąsko     return true;
283cd74dd17STomasz Miąsko   case 'm':
284cd74dd17STomasz Miąsko     Type = BasicType::U32;
285cd74dd17STomasz Miąsko     return true;
286cd74dd17STomasz Miąsko   case 'n':
287cd74dd17STomasz Miąsko     Type = BasicType::I128;
288cd74dd17STomasz Miąsko     return true;
289cd74dd17STomasz Miąsko   case 'o':
290cd74dd17STomasz Miąsko     Type = BasicType::U128;
291cd74dd17STomasz Miąsko     return true;
292cd74dd17STomasz Miąsko   case 'p':
293cd74dd17STomasz Miąsko     Type = BasicType::Placeholder;
294cd74dd17STomasz Miąsko     return true;
295cd74dd17STomasz Miąsko   case 's':
296cd74dd17STomasz Miąsko     Type = BasicType::I16;
297cd74dd17STomasz Miąsko     return true;
298cd74dd17STomasz Miąsko   case 't':
299cd74dd17STomasz Miąsko     Type = BasicType::U16;
300cd74dd17STomasz Miąsko     return true;
301cd74dd17STomasz Miąsko   case 'u':
302cd74dd17STomasz Miąsko     Type = BasicType::Unit;
303cd74dd17STomasz Miąsko     return true;
304cd74dd17STomasz Miąsko   case 'v':
305cd74dd17STomasz Miąsko     Type = BasicType::Variadic;
306cd74dd17STomasz Miąsko     return true;
307cd74dd17STomasz Miąsko   case 'x':
308cd74dd17STomasz Miąsko     Type = BasicType::I64;
309cd74dd17STomasz Miąsko     return true;
310cd74dd17STomasz Miąsko   case 'y':
311cd74dd17STomasz Miąsko     Type = BasicType::U64;
312cd74dd17STomasz Miąsko     return true;
313cd74dd17STomasz Miąsko   case 'z':
314cd74dd17STomasz Miąsko     Type = BasicType::Never;
315cd74dd17STomasz Miąsko     return true;
316cd74dd17STomasz Miąsko   default:
317cd74dd17STomasz Miąsko     return false;
318cd74dd17STomasz Miąsko   }
319cd74dd17STomasz Miąsko }
320cd74dd17STomasz Miąsko 
321cd74dd17STomasz Miąsko void Demangler::printBasicType(BasicType Type) {
322cd74dd17STomasz Miąsko   switch (Type) {
323cd74dd17STomasz Miąsko   case BasicType::Bool:
324cd74dd17STomasz Miąsko     print("bool");
325cd74dd17STomasz Miąsko     break;
326cd74dd17STomasz Miąsko   case BasicType::Char:
327cd74dd17STomasz Miąsko     print("char");
328cd74dd17STomasz Miąsko     break;
329cd74dd17STomasz Miąsko   case BasicType::I8:
330cd74dd17STomasz Miąsko     print("i8");
331cd74dd17STomasz Miąsko     break;
332cd74dd17STomasz Miąsko   case BasicType::I16:
333cd74dd17STomasz Miąsko     print("i16");
334cd74dd17STomasz Miąsko     break;
335cd74dd17STomasz Miąsko   case BasicType::I32:
336cd74dd17STomasz Miąsko     print("i32");
337cd74dd17STomasz Miąsko     break;
338cd74dd17STomasz Miąsko   case BasicType::I64:
339cd74dd17STomasz Miąsko     print("i64");
340cd74dd17STomasz Miąsko     break;
341cd74dd17STomasz Miąsko   case BasicType::I128:
342cd74dd17STomasz Miąsko     print("i128");
343cd74dd17STomasz Miąsko     break;
344cd74dd17STomasz Miąsko   case BasicType::ISize:
345cd74dd17STomasz Miąsko     print("isize");
346cd74dd17STomasz Miąsko     break;
347cd74dd17STomasz Miąsko   case BasicType::U8:
348cd74dd17STomasz Miąsko     print("u8");
349cd74dd17STomasz Miąsko     break;
350cd74dd17STomasz Miąsko   case BasicType::U16:
351cd74dd17STomasz Miąsko     print("u16");
352cd74dd17STomasz Miąsko     break;
353cd74dd17STomasz Miąsko   case BasicType::U32:
354cd74dd17STomasz Miąsko     print("u32");
355cd74dd17STomasz Miąsko     break;
356cd74dd17STomasz Miąsko   case BasicType::U64:
357cd74dd17STomasz Miąsko     print("u64");
358cd74dd17STomasz Miąsko     break;
359cd74dd17STomasz Miąsko   case BasicType::U128:
360cd74dd17STomasz Miąsko     print("u128");
361cd74dd17STomasz Miąsko     break;
362cd74dd17STomasz Miąsko   case BasicType::USize:
363cd74dd17STomasz Miąsko     print("usize");
364cd74dd17STomasz Miąsko     break;
365cd74dd17STomasz Miąsko   case BasicType::F32:
366cd74dd17STomasz Miąsko     print("f32");
367cd74dd17STomasz Miąsko     break;
368cd74dd17STomasz Miąsko   case BasicType::F64:
369cd74dd17STomasz Miąsko     print("f64");
370cd74dd17STomasz Miąsko     break;
371cd74dd17STomasz Miąsko   case BasicType::Str:
372cd74dd17STomasz Miąsko     print("str");
373cd74dd17STomasz Miąsko     break;
374cd74dd17STomasz Miąsko   case BasicType::Placeholder:
375cd74dd17STomasz Miąsko     print("_");
376cd74dd17STomasz Miąsko     break;
377cd74dd17STomasz Miąsko   case BasicType::Unit:
378cd74dd17STomasz Miąsko     print("()");
379cd74dd17STomasz Miąsko     break;
380cd74dd17STomasz Miąsko   case BasicType::Variadic:
381cd74dd17STomasz Miąsko     print("...");
382cd74dd17STomasz Miąsko     break;
383cd74dd17STomasz Miąsko   case BasicType::Never:
384cd74dd17STomasz Miąsko     print("!");
385cd74dd17STomasz Miąsko     break;
386cd74dd17STomasz Miąsko   }
3872961f863STomasz Miąsko }
3882961f863STomasz Miąsko 
3892961f863STomasz Miąsko // <type> = | <basic-type>
3902961f863STomasz Miąsko //          | <path>                      // named type
3912961f863STomasz Miąsko //          | "A" <type> <const>          // [T; N]
3922961f863STomasz Miąsko //          | "S" <type>                  // [T]
3932961f863STomasz Miąsko //          | "T" {<type>} "E"            // (T1, T2, T3, ...)
3942961f863STomasz Miąsko //          | "R" [<lifetime>] <type>     // &T
3952961f863STomasz Miąsko //          | "Q" [<lifetime>] <type>     // &mut T
3962961f863STomasz Miąsko //          | "P" <type>                  // *const T
3972961f863STomasz Miąsko //          | "O" <type>                  // *mut T
3982961f863STomasz Miąsko //          | "F" <fn-sig>                // fn(...) -> ...
3992961f863STomasz Miąsko //          | "D" <dyn-bounds> <lifetime> // dyn Trait<Assoc = X> + Send + 'a
4002961f863STomasz Miąsko //          | <backref>                   // backref
4012961f863STomasz Miąsko void Demangler::demangleType() {
402cd74dd17STomasz Miąsko   BasicType Type;
403cd74dd17STomasz Miąsko   if (parseBasicType(consume(), Type))
404cd74dd17STomasz Miąsko     printBasicType(Type);
405cd74dd17STomasz Miąsko   else
406cd74dd17STomasz Miąsko     Error = true; // FIXME parse remaining productions.
407cd74dd17STomasz Miąsko }
408cd74dd17STomasz Miąsko 
409cd74dd17STomasz Miąsko // <const> = <basic-type> <const-data>
410cd74dd17STomasz Miąsko //         | "p"                          // placeholder
411cd74dd17STomasz Miąsko //         | <backref>
412cd74dd17STomasz Miąsko void Demangler::demangleConst() {
413cd74dd17STomasz Miąsko   BasicType Type;
414cd74dd17STomasz Miąsko   if (parseBasicType(consume(), Type)) {
415cd74dd17STomasz Miąsko     switch (Type) {
416cd74dd17STomasz Miąsko     case BasicType::I8:
417cd74dd17STomasz Miąsko     case BasicType::I16:
418cd74dd17STomasz Miąsko     case BasicType::I32:
419cd74dd17STomasz Miąsko     case BasicType::I64:
420cd74dd17STomasz Miąsko     case BasicType::I128:
421cd74dd17STomasz Miąsko     case BasicType::ISize:
422cd74dd17STomasz Miąsko     case BasicType::U8:
423cd74dd17STomasz Miąsko     case BasicType::U16:
424cd74dd17STomasz Miąsko     case BasicType::U32:
425cd74dd17STomasz Miąsko     case BasicType::U64:
426cd74dd17STomasz Miąsko     case BasicType::U128:
427cd74dd17STomasz Miąsko     case BasicType::USize:
428cd74dd17STomasz Miąsko       demangleConstInt();
429cd74dd17STomasz Miąsko       break;
430fc0f2bb9STomasz Miąsko     case BasicType::Bool:
431fc0f2bb9STomasz Miąsko       demangleConstBool();
432fc0f2bb9STomasz Miąsko       break;
4332ba49f6aSTomasz Miąsko     case BasicType::Char:
4342ba49f6aSTomasz Miąsko       demangleConstChar();
4352ba49f6aSTomasz Miąsko       break;
436cd74dd17STomasz Miąsko     case BasicType::Placeholder:
437cd74dd17STomasz Miąsko       print('_');
438cd74dd17STomasz Miąsko       break;
439cd74dd17STomasz Miąsko     default:
4402ba49f6aSTomasz Miąsko       // FIXME demangle backreferences.
4412961f863STomasz Miąsko       Error = true;
442cd74dd17STomasz Miąsko       break;
443cd74dd17STomasz Miąsko     }
444cd74dd17STomasz Miąsko   } else {
445cd74dd17STomasz Miąsko     Error = true;
446cd74dd17STomasz Miąsko   }
447cd74dd17STomasz Miąsko }
448cd74dd17STomasz Miąsko 
449cd74dd17STomasz Miąsko // <const-data> = ["n"] <hex-number>
450cd74dd17STomasz Miąsko void Demangler::demangleConstInt() {
451cd74dd17STomasz Miąsko   if (consumeIf('n'))
452cd74dd17STomasz Miąsko     print('-');
453cd74dd17STomasz Miąsko 
454cd74dd17STomasz Miąsko   StringView HexDigits;
455cd74dd17STomasz Miąsko   uint64_t Value = parseHexNumber(HexDigits);
456cd74dd17STomasz Miąsko   if (HexDigits.size() <= 16) {
457cd74dd17STomasz Miąsko     printDecimalNumber(Value);
458cd74dd17STomasz Miąsko   } else {
459cd74dd17STomasz Miąsko     print("0x");
460cd74dd17STomasz Miąsko     print(HexDigits);
4612961f863STomasz Miąsko   }
4622961f863STomasz Miąsko }
4632961f863STomasz Miąsko 
464fc0f2bb9STomasz Miąsko // <const-data> = "0_" // false
465fc0f2bb9STomasz Miąsko //              | "1_" // true
466fc0f2bb9STomasz Miąsko void Demangler::demangleConstBool() {
467fc0f2bb9STomasz Miąsko   StringView HexDigits;
468fc0f2bb9STomasz Miąsko   parseHexNumber(HexDigits);
469fc0f2bb9STomasz Miąsko   if (HexDigits == "0")
470fc0f2bb9STomasz Miąsko     print("false");
471fc0f2bb9STomasz Miąsko   else if (HexDigits == "1")
472fc0f2bb9STomasz Miąsko     print("true");
473fc0f2bb9STomasz Miąsko   else
474fc0f2bb9STomasz Miąsko     Error = true;
475fc0f2bb9STomasz Miąsko }
476fc0f2bb9STomasz Miąsko 
4772ba49f6aSTomasz Miąsko /// Returns true if CodePoint represents a printable ASCII character.
4782ba49f6aSTomasz Miąsko static bool isAsciiPrintable(uint64_t CodePoint) {
4792ba49f6aSTomasz Miąsko   return 0x20 <= CodePoint && CodePoint <= 0x7e;
4802ba49f6aSTomasz Miąsko }
4812ba49f6aSTomasz Miąsko 
4822ba49f6aSTomasz Miąsko // <const-data> = <hex-number>
4832ba49f6aSTomasz Miąsko void Demangler::demangleConstChar() {
4842ba49f6aSTomasz Miąsko   StringView HexDigits;
4852ba49f6aSTomasz Miąsko   uint64_t CodePoint = parseHexNumber(HexDigits);
4862ba49f6aSTomasz Miąsko   if (Error || HexDigits.size() > 6) {
4872ba49f6aSTomasz Miąsko     Error = true;
4882ba49f6aSTomasz Miąsko     return;
4892ba49f6aSTomasz Miąsko   }
4902ba49f6aSTomasz Miąsko 
4912ba49f6aSTomasz Miąsko   print("'");
4922ba49f6aSTomasz Miąsko   switch (CodePoint) {
4932ba49f6aSTomasz Miąsko   case '\t':
4942ba49f6aSTomasz Miąsko     print(R"(\t)");
4952ba49f6aSTomasz Miąsko     break;
4962ba49f6aSTomasz Miąsko   case '\r':
4972ba49f6aSTomasz Miąsko     print(R"(\r)");
4982ba49f6aSTomasz Miąsko     break;
4992ba49f6aSTomasz Miąsko   case '\n':
5002ba49f6aSTomasz Miąsko     print(R"(\n)");
5012ba49f6aSTomasz Miąsko     break;
5022ba49f6aSTomasz Miąsko   case '\\':
5032ba49f6aSTomasz Miąsko     print(R"(\\)");
5042ba49f6aSTomasz Miąsko     break;
5052ba49f6aSTomasz Miąsko   case '"':
5062ba49f6aSTomasz Miąsko     print(R"(")");
5072ba49f6aSTomasz Miąsko     break;
5082ba49f6aSTomasz Miąsko   case '\'':
5092ba49f6aSTomasz Miąsko     print(R"(\')");
5102ba49f6aSTomasz Miąsko     break;
5112ba49f6aSTomasz Miąsko   default:
5122ba49f6aSTomasz Miąsko     if (isAsciiPrintable(CodePoint)) {
5132ba49f6aSTomasz Miąsko       char C = CodePoint;
5142ba49f6aSTomasz Miąsko       print(C);
5152ba49f6aSTomasz Miąsko     } else {
5162ba49f6aSTomasz Miąsko       print(R"(\u{)");
5172ba49f6aSTomasz Miąsko       print(HexDigits);
5182ba49f6aSTomasz Miąsko       print('}');
5192ba49f6aSTomasz Miąsko     }
5202ba49f6aSTomasz Miąsko     break;
5212ba49f6aSTomasz Miąsko   }
5222ba49f6aSTomasz Miąsko   print('\'');
5232ba49f6aSTomasz Miąsko }
5242ba49f6aSTomasz Miąsko 
5257310403eSTomasz Miąsko // <undisambiguated-identifier> = ["u"] <decimal-number> ["_"] <bytes>
5267310403eSTomasz Miąsko Identifier Demangler::parseIdentifier() {
5277310403eSTomasz Miąsko   bool Punycode = consumeIf('u');
5287310403eSTomasz Miąsko   uint64_t Bytes = parseDecimalNumber();
5297310403eSTomasz Miąsko 
5307310403eSTomasz Miąsko   // Underscore resolves the ambiguity when identifier starts with a decimal
5317310403eSTomasz Miąsko   // digit or another underscore.
5327310403eSTomasz Miąsko   consumeIf('_');
5337310403eSTomasz Miąsko 
5347310403eSTomasz Miąsko   if (Error || Bytes > Input.size() - Position) {
5357310403eSTomasz Miąsko     Error = true;
5367310403eSTomasz Miąsko     return {};
5377310403eSTomasz Miąsko   }
5387310403eSTomasz Miąsko   StringView S = Input.substr(Position, Bytes);
5397310403eSTomasz Miąsko   Position += Bytes;
5407310403eSTomasz Miąsko 
5417310403eSTomasz Miąsko   if (!std::all_of(S.begin(), S.end(), isValid)) {
5427310403eSTomasz Miąsko     Error = true;
5437310403eSTomasz Miąsko     return {};
5447310403eSTomasz Miąsko   }
5457310403eSTomasz Miąsko 
5467310403eSTomasz Miąsko   return {S, Punycode};
5477310403eSTomasz Miąsko }
5487310403eSTomasz Miąsko 
5497310403eSTomasz Miąsko // Parses optional base 62 number. The presence of a number is determined using
55078e94915STomasz Miąsko // Tag. Returns 0 when tag is absent and parsed value + 1 otherwise.
55178e94915STomasz Miąsko uint64_t Demangler::parseOptionalBase62Number(char Tag) {
55278e94915STomasz Miąsko   if (!consumeIf(Tag))
55378e94915STomasz Miąsko     return 0;
55478e94915STomasz Miąsko 
55578e94915STomasz Miąsko   uint64_t N = parseBase62Number();
55678e94915STomasz Miąsko   if (Error || !addAssign(N, 1))
55778e94915STomasz Miąsko     return 0;
55878e94915STomasz Miąsko 
55978e94915STomasz Miąsko   return N;
5607310403eSTomasz Miąsko }
5617310403eSTomasz Miąsko 
5627310403eSTomasz Miąsko // Parses base 62 number with <0-9a-zA-Z> as digits. Number is terminated by
5637310403eSTomasz Miąsko // "_". All values are offset by 1, so that "_" encodes 0, "0_" encodes 1,
5647310403eSTomasz Miąsko // "1_" encodes 2, etc.
5657310403eSTomasz Miąsko //
5667310403eSTomasz Miąsko // <base-62-number> = {<0-9a-zA-Z>} "_"
5677310403eSTomasz Miąsko uint64_t Demangler::parseBase62Number() {
5687310403eSTomasz Miąsko   if (consumeIf('_'))
5697310403eSTomasz Miąsko     return 0;
5707310403eSTomasz Miąsko 
5717310403eSTomasz Miąsko   uint64_t Value = 0;
5727310403eSTomasz Miąsko 
5737310403eSTomasz Miąsko   while (true) {
5747310403eSTomasz Miąsko     uint64_t Digit;
5757310403eSTomasz Miąsko     char C = consume();
5767310403eSTomasz Miąsko 
5777310403eSTomasz Miąsko     if (C == '_') {
5787310403eSTomasz Miąsko       break;
5797310403eSTomasz Miąsko     } else if (isDigit(C)) {
5807310403eSTomasz Miąsko       Digit = C - '0';
5817310403eSTomasz Miąsko     } else if (isLower(C)) {
5827310403eSTomasz Miąsko       Digit = 10 + (C - 'a');
5837310403eSTomasz Miąsko     } else if (isUpper(C)) {
5847310403eSTomasz Miąsko       Digit = 10 + 26 + (C - 'A');
5857310403eSTomasz Miąsko     } else {
5867310403eSTomasz Miąsko       Error = true;
5877310403eSTomasz Miąsko       return 0;
5887310403eSTomasz Miąsko     }
5897310403eSTomasz Miąsko 
5907310403eSTomasz Miąsko     if (!mulAssign(Value, 62))
5917310403eSTomasz Miąsko       return 0;
5927310403eSTomasz Miąsko 
5937310403eSTomasz Miąsko     if (!addAssign(Value, Digit))
5947310403eSTomasz Miąsko       return 0;
5957310403eSTomasz Miąsko   }
5967310403eSTomasz Miąsko 
5977310403eSTomasz Miąsko   if (!addAssign(Value, 1))
5987310403eSTomasz Miąsko     return 0;
5997310403eSTomasz Miąsko 
6007310403eSTomasz Miąsko   return Value;
6017310403eSTomasz Miąsko }
6027310403eSTomasz Miąsko 
6037310403eSTomasz Miąsko // Parses a decimal number that had been encoded without any leading zeros.
6047310403eSTomasz Miąsko //
6057310403eSTomasz Miąsko // <decimal-number> = "0"
6067310403eSTomasz Miąsko //                  | <1-9> {<0-9>}
6077310403eSTomasz Miąsko uint64_t Demangler::parseDecimalNumber() {
6087310403eSTomasz Miąsko   char C = look();
6097310403eSTomasz Miąsko   if (!isDigit(C)) {
6107310403eSTomasz Miąsko     Error = true;
6117310403eSTomasz Miąsko     return 0;
6127310403eSTomasz Miąsko   }
6137310403eSTomasz Miąsko 
6147310403eSTomasz Miąsko   if (C == '0') {
6157310403eSTomasz Miąsko     consume();
6167310403eSTomasz Miąsko     return 0;
6177310403eSTomasz Miąsko   }
6187310403eSTomasz Miąsko 
6197310403eSTomasz Miąsko   uint64_t Value = 0;
6207310403eSTomasz Miąsko 
6217310403eSTomasz Miąsko   while (isDigit(look())) {
6227310403eSTomasz Miąsko     if (!mulAssign(Value, 10)) {
6237310403eSTomasz Miąsko       Error = true;
6247310403eSTomasz Miąsko       return 0;
6257310403eSTomasz Miąsko     }
6267310403eSTomasz Miąsko 
6277310403eSTomasz Miąsko     uint64_t D = consume() - '0';
6287310403eSTomasz Miąsko     if (!addAssign(Value, D))
6297310403eSTomasz Miąsko       return 0;
6307310403eSTomasz Miąsko   }
6317310403eSTomasz Miąsko 
6327310403eSTomasz Miąsko   return Value;
6337310403eSTomasz Miąsko }
634cd74dd17STomasz Miąsko 
635cd74dd17STomasz Miąsko // Parses a hexadecimal number with <0-9a-f> as a digits. Returns the parsed
636cd74dd17STomasz Miąsko // value and stores hex digits in HexDigits. The return value is unspecified if
637cd74dd17STomasz Miąsko // HexDigits.size() > 16.
638cd74dd17STomasz Miąsko //
639cd74dd17STomasz Miąsko // <hex-number> = "0_"
640cd74dd17STomasz Miąsko //              | <1-9a-f> {<0-9a-f>} "_"
641cd74dd17STomasz Miąsko uint64_t Demangler::parseHexNumber(StringView &HexDigits) {
642cd74dd17STomasz Miąsko   size_t Start = Position;
643cd74dd17STomasz Miąsko   uint64_t Value = 0;
644cd74dd17STomasz Miąsko 
645cd74dd17STomasz Miąsko   if (!isHexDigit(look()))
646cd74dd17STomasz Miąsko     Error = true;
647cd74dd17STomasz Miąsko 
648cd74dd17STomasz Miąsko   if (consumeIf('0')) {
649cd74dd17STomasz Miąsko     if (!consumeIf('_'))
650cd74dd17STomasz Miąsko       Error = true;
651cd74dd17STomasz Miąsko   } else {
652cd74dd17STomasz Miąsko     while (!Error && !consumeIf('_')) {
653cd74dd17STomasz Miąsko       char C = consume();
654cd74dd17STomasz Miąsko       Value *= 16;
655cd74dd17STomasz Miąsko       if (isDigit(C))
656cd74dd17STomasz Miąsko         Value += C - '0';
657cd74dd17STomasz Miąsko       else if ('a' <= C && C <= 'f')
658cd74dd17STomasz Miąsko         Value += 10 + (C - 'a');
659cd74dd17STomasz Miąsko       else
660cd74dd17STomasz Miąsko         Error = true;
661cd74dd17STomasz Miąsko     }
662cd74dd17STomasz Miąsko   }
663cd74dd17STomasz Miąsko 
664cd74dd17STomasz Miąsko   if (Error) {
665cd74dd17STomasz Miąsko     HexDigits = StringView();
666cd74dd17STomasz Miąsko     return 0;
667cd74dd17STomasz Miąsko   }
668cd74dd17STomasz Miąsko 
669cd74dd17STomasz Miąsko   size_t End = Position - 1;
670cd74dd17STomasz Miąsko   assert(Start < End);
671cd74dd17STomasz Miąsko   HexDigits = Input.substr(Start, End - Start);
672cd74dd17STomasz Miąsko   return Value;
673cd74dd17STomasz Miąsko }
674