17310403eSTomasz Miąsko //===--- RustDemangle.cpp ---------------------------------------*- C++ -*-===//
27310403eSTomasz Miąsko //
37310403eSTomasz Miąsko // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
47310403eSTomasz Miąsko // See https://llvm.org/LICENSE.txt for license information.
57310403eSTomasz Miąsko // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
67310403eSTomasz Miąsko //
77310403eSTomasz Miąsko //===----------------------------------------------------------------------===//
87310403eSTomasz Miąsko //
97310403eSTomasz Miąsko // This file defines a demangler for Rust v0 mangled symbols as specified in
107310403eSTomasz Miąsko // https://rust-lang.github.io/rfcs/2603-rust-symbol-name-mangling-v0.html
117310403eSTomasz Miąsko //
127310403eSTomasz Miąsko //===----------------------------------------------------------------------===//
137310403eSTomasz Miąsko 
147310403eSTomasz Miąsko #include "llvm/Demangle/RustDemangle.h"
157310403eSTomasz Miąsko #include "llvm/Demangle/Demangle.h"
167310403eSTomasz Miąsko 
177310403eSTomasz Miąsko #include <algorithm>
187310403eSTomasz Miąsko #include <cassert>
197310403eSTomasz Miąsko #include <cstring>
207310403eSTomasz Miąsko #include <limits>
217310403eSTomasz Miąsko 
227310403eSTomasz Miąsko using namespace llvm;
237310403eSTomasz Miąsko using namespace rust_demangle;
247310403eSTomasz Miąsko 
257310403eSTomasz Miąsko char *llvm::rustDemangle(const char *MangledName, char *Buf, size_t *N,
267310403eSTomasz Miąsko                          int *Status) {
277310403eSTomasz Miąsko   if (MangledName == nullptr || (Buf != nullptr && N == nullptr)) {
287310403eSTomasz Miąsko     if (Status != nullptr)
297310403eSTomasz Miąsko       *Status = demangle_invalid_args;
307310403eSTomasz Miąsko     return nullptr;
317310403eSTomasz Miąsko   }
327310403eSTomasz Miąsko 
337310403eSTomasz Miąsko   // Return early if mangled name doesn't look like a Rust symbol.
347310403eSTomasz Miąsko   StringView Mangled(MangledName);
357310403eSTomasz Miąsko   if (!Mangled.startsWith("_R")) {
367310403eSTomasz Miąsko     if (Status != nullptr)
377310403eSTomasz Miąsko       *Status = demangle_invalid_mangled_name;
387310403eSTomasz Miąsko     return nullptr;
397310403eSTomasz Miąsko   }
407310403eSTomasz Miąsko 
417310403eSTomasz Miąsko   Demangler D;
427310403eSTomasz Miąsko   if (!initializeOutputStream(nullptr, nullptr, D.Output, 1024)) {
437310403eSTomasz Miąsko     if (Status != nullptr)
447310403eSTomasz Miąsko       *Status = demangle_memory_alloc_failure;
457310403eSTomasz Miąsko     return nullptr;
467310403eSTomasz Miąsko   }
477310403eSTomasz Miąsko 
487310403eSTomasz Miąsko   if (!D.demangle(Mangled)) {
497310403eSTomasz Miąsko     if (Status != nullptr)
507310403eSTomasz Miąsko       *Status = demangle_invalid_mangled_name;
517310403eSTomasz Miąsko     std::free(D.Output.getBuffer());
527310403eSTomasz Miąsko     return nullptr;
537310403eSTomasz Miąsko   }
547310403eSTomasz Miąsko 
557310403eSTomasz Miąsko   D.Output += '\0';
567310403eSTomasz Miąsko   char *Demangled = D.Output.getBuffer();
577310403eSTomasz Miąsko   size_t DemangledLen = D.Output.getCurrentPosition();
587310403eSTomasz Miąsko 
597310403eSTomasz Miąsko   if (Buf != nullptr) {
607310403eSTomasz Miąsko     if (DemangledLen <= *N) {
617310403eSTomasz Miąsko       std::memcpy(Buf, Demangled, DemangledLen);
627310403eSTomasz Miąsko       std::free(Demangled);
637310403eSTomasz Miąsko       Demangled = Buf;
647310403eSTomasz Miąsko     } else {
657310403eSTomasz Miąsko       std::free(Buf);
667310403eSTomasz Miąsko     }
677310403eSTomasz Miąsko   }
687310403eSTomasz Miąsko 
697310403eSTomasz Miąsko   if (N != nullptr)
707310403eSTomasz Miąsko     *N = DemangledLen;
717310403eSTomasz Miąsko 
727310403eSTomasz Miąsko   if (Status != nullptr)
737310403eSTomasz Miąsko     *Status = demangle_success;
747310403eSTomasz Miąsko 
757310403eSTomasz Miąsko   return Demangled;
767310403eSTomasz Miąsko }
777310403eSTomasz Miąsko 
787310403eSTomasz Miąsko Demangler::Demangler(size_t MaxRecursionLevel)
797310403eSTomasz Miąsko     : MaxRecursionLevel(MaxRecursionLevel) {}
807310403eSTomasz Miąsko 
817310403eSTomasz Miąsko static inline bool isDigit(const char C) { return '0' <= C && C <= '9'; }
827310403eSTomasz Miąsko 
83cd74dd17STomasz Miąsko static inline bool isHexDigit(const char C) {
84cd74dd17STomasz Miąsko   return ('0' <= C && C <= '9') || ('a' <= C && C <= 'f');
85cd74dd17STomasz Miąsko }
86cd74dd17STomasz Miąsko 
877310403eSTomasz Miąsko static inline bool isLower(const char C) { return 'a' <= C && C <= 'z'; }
887310403eSTomasz Miąsko 
897310403eSTomasz Miąsko static inline bool isUpper(const char C) { return 'A' <= C && C <= 'Z'; }
907310403eSTomasz Miąsko 
917310403eSTomasz Miąsko /// Returns true if C is a valid mangled character: <0-9a-zA-Z_>.
927310403eSTomasz Miąsko static inline bool isValid(const char C) {
937310403eSTomasz Miąsko   return isDigit(C) || isLower(C) || isUpper(C) || C == '_';
947310403eSTomasz Miąsko }
957310403eSTomasz Miąsko 
967310403eSTomasz Miąsko // Demangles Rust v0 mangled symbol. Returns true when successful, and false
977310403eSTomasz Miąsko // otherwise. The demangled symbol is stored in Output field. It is
987310403eSTomasz Miąsko // responsibility of the caller to free the memory behind the output stream.
997310403eSTomasz Miąsko //
1007310403eSTomasz Miąsko // <symbol-name> = "_R" <path> [<instantiating-crate>]
1017310403eSTomasz Miąsko bool Demangler::demangle(StringView Mangled) {
1027310403eSTomasz Miąsko   Position = 0;
1037310403eSTomasz Miąsko   Error = false;
104f0f2a8b2STomasz Miąsko   Print = true;
1057310403eSTomasz Miąsko   RecursionLevel = 0;
1067310403eSTomasz Miąsko 
1077310403eSTomasz Miąsko   if (!Mangled.consumeFront("_R")) {
1087310403eSTomasz Miąsko     Error = true;
1097310403eSTomasz Miąsko     return false;
1107310403eSTomasz Miąsko   }
1117310403eSTomasz Miąsko   Input = Mangled;
1127310403eSTomasz Miąsko 
11357f40886STomasz Miąsko   demanglePath(rust_demangle::InType::No);
1147310403eSTomasz Miąsko 
1157310403eSTomasz Miąsko   // FIXME parse optional <instantiating-crate>.
1167310403eSTomasz Miąsko 
1177310403eSTomasz Miąsko   if (Position != Input.size())
1187310403eSTomasz Miąsko     Error = true;
1197310403eSTomasz Miąsko 
1207310403eSTomasz Miąsko   return !Error;
1217310403eSTomasz Miąsko }
1227310403eSTomasz Miąsko 
12306833297STomasz Miąsko // Demangles a path. InType indicates whether a path is inside a type.
12406833297STomasz Miąsko //
1257310403eSTomasz Miąsko // <path> = "C" <identifier>               // crate root
1267310403eSTomasz Miąsko //        | "M" <impl-path> <type>         // <T> (inherent impl)
1277310403eSTomasz Miąsko //        | "X" <impl-path> <type> <path>  // <T as Trait> (trait impl)
1287310403eSTomasz Miąsko //        | "Y" <type> <path>              // <T as Trait> (trait definition)
1297310403eSTomasz Miąsko //        | "N" <ns> <path> <identifier>   // ...::ident (nested path)
1307310403eSTomasz Miąsko //        | "I" <path> {<generic-arg>} "E" // ...<T, U> (generic args)
1317310403eSTomasz Miąsko //        | <backref>
1327310403eSTomasz Miąsko // <identifier> = [<disambiguator>] <undisambiguated-identifier>
1337310403eSTomasz Miąsko // <ns> = "C"      // closure
1347310403eSTomasz Miąsko //      | "S"      // shim
1357310403eSTomasz Miąsko //      | <A-Z>    // other special namespaces
1367310403eSTomasz Miąsko //      | <a-z>    // internal namespaces
13706833297STomasz Miąsko void Demangler::demanglePath(InType InType) {
1387310403eSTomasz Miąsko   if (Error || RecursionLevel >= MaxRecursionLevel) {
1397310403eSTomasz Miąsko     Error = true;
1407310403eSTomasz Miąsko     return;
1417310403eSTomasz Miąsko   }
14278e94915STomasz Miąsko   SwapAndRestore<size_t> SaveRecursionLevel(RecursionLevel, RecursionLevel + 1);
1437310403eSTomasz Miąsko 
1447310403eSTomasz Miąsko   switch (consume()) {
1457310403eSTomasz Miąsko   case 'C': {
1467310403eSTomasz Miąsko     parseOptionalBase62Number('s');
1477310403eSTomasz Miąsko     Identifier Ident = parseIdentifier();
1487310403eSTomasz Miąsko     print(Ident.Name);
1497310403eSTomasz Miąsko     break;
1507310403eSTomasz Miąsko   }
151f0f2a8b2STomasz Miąsko   case 'M': {
15206833297STomasz Miąsko     demangleImplPath(InType);
153f0f2a8b2STomasz Miąsko     print("<");
154f0f2a8b2STomasz Miąsko     demangleType();
155f0f2a8b2STomasz Miąsko     print(">");
156f0f2a8b2STomasz Miąsko     break;
157f0f2a8b2STomasz Miąsko   }
1589fa13800STomasz Miąsko   case 'X': {
15906833297STomasz Miąsko     demangleImplPath(InType);
1609fa13800STomasz Miąsko     print("<");
1619fa13800STomasz Miąsko     demangleType();
1629fa13800STomasz Miąsko     print(" as ");
16357f40886STomasz Miąsko     demanglePath(rust_demangle::InType::Yes);
1649fa13800STomasz Miąsko     print(">");
1659fa13800STomasz Miąsko     break;
1669fa13800STomasz Miąsko   }
167f933f7fbSTomasz Miąsko   case 'Y': {
168f933f7fbSTomasz Miąsko     print("<");
169f933f7fbSTomasz Miąsko     demangleType();
170f933f7fbSTomasz Miąsko     print(" as ");
17157f40886STomasz Miąsko     demanglePath(rust_demangle::InType::Yes);
172f933f7fbSTomasz Miąsko     print(">");
173f933f7fbSTomasz Miąsko     break;
174f933f7fbSTomasz Miąsko   }
1757310403eSTomasz Miąsko   case 'N': {
1767310403eSTomasz Miąsko     char NS = consume();
1777310403eSTomasz Miąsko     if (!isLower(NS) && !isUpper(NS)) {
1787310403eSTomasz Miąsko       Error = true;
1797310403eSTomasz Miąsko       break;
1807310403eSTomasz Miąsko     }
18106833297STomasz Miąsko     demanglePath(InType);
1827310403eSTomasz Miąsko 
18378e94915STomasz Miąsko     uint64_t Disambiguator = parseOptionalBase62Number('s');
1847310403eSTomasz Miąsko     Identifier Ident = parseIdentifier();
1857310403eSTomasz Miąsko 
18678e94915STomasz Miąsko     if (isUpper(NS)) {
18778e94915STomasz Miąsko       // Special namespaces
18878e94915STomasz Miąsko       print("::{");
18978e94915STomasz Miąsko       if (NS == 'C')
19078e94915STomasz Miąsko         print("closure");
19178e94915STomasz Miąsko       else if (NS == 'S')
19278e94915STomasz Miąsko         print("shim");
19378e94915STomasz Miąsko       else
19478e94915STomasz Miąsko         print(NS);
1957310403eSTomasz Miąsko       if (!Ident.empty()) {
19678e94915STomasz Miąsko         print(":");
19778e94915STomasz Miąsko         print(Ident.Name);
19878e94915STomasz Miąsko       }
19978e94915STomasz Miąsko       print('#');
20078e94915STomasz Miąsko       printDecimalNumber(Disambiguator);
20178e94915STomasz Miąsko       print('}');
20278e94915STomasz Miąsko     } else {
20378e94915STomasz Miąsko       // Implementation internal namespaces.
20478e94915STomasz Miąsko       if (!Ident.empty()) {
2057310403eSTomasz Miąsko         print("::");
2067310403eSTomasz Miąsko         print(Ident.Name);
2077310403eSTomasz Miąsko       }
20878e94915STomasz Miąsko     }
2097310403eSTomasz Miąsko     break;
2107310403eSTomasz Miąsko   }
2112961f863STomasz Miąsko   case 'I': {
21206833297STomasz Miąsko     demanglePath(InType);
21306833297STomasz Miąsko     // Omit "::" when in a type, where it is optional.
21457f40886STomasz Miąsko     if (InType == rust_demangle::InType::No)
21506833297STomasz Miąsko       print("::");
21606833297STomasz Miąsko     print("<");
2172961f863STomasz Miąsko     for (size_t I = 0; !Error && !consumeIf('E'); ++I) {
2182961f863STomasz Miąsko       if (I > 0)
2192961f863STomasz Miąsko         print(", ");
2202961f863STomasz Miąsko       demangleGenericArg();
2212961f863STomasz Miąsko     }
2222961f863STomasz Miąsko     print(">");
2232961f863STomasz Miąsko     break;
2242961f863STomasz Miąsko   }
2257310403eSTomasz Miąsko   default:
2267310403eSTomasz Miąsko     // FIXME parse remaining productions.
2277310403eSTomasz Miąsko     Error = true;
2287310403eSTomasz Miąsko     break;
2297310403eSTomasz Miąsko   }
2307310403eSTomasz Miąsko }
2317310403eSTomasz Miąsko 
232f0f2a8b2STomasz Miąsko // <impl-path> = [<disambiguator>] <path>
233f0f2a8b2STomasz Miąsko // <disambiguator> = "s" <base-62-number>
23406833297STomasz Miąsko void Demangler::demangleImplPath(InType InType) {
235f0f2a8b2STomasz Miąsko   SwapAndRestore<bool> SavePrint(Print, false);
236f0f2a8b2STomasz Miąsko   parseOptionalBase62Number('s');
23706833297STomasz Miąsko   demanglePath(InType);
238f0f2a8b2STomasz Miąsko }
239f0f2a8b2STomasz Miąsko 
2402961f863STomasz Miąsko // <generic-arg> = <lifetime>
2412961f863STomasz Miąsko //               | <type>
2422961f863STomasz Miąsko //               | "K" <const>
2432961f863STomasz Miąsko // <lifetime> = "L" <base-62-number>
2442961f863STomasz Miąsko void Demangler::demangleGenericArg() {
245cd74dd17STomasz Miąsko   if (consumeIf('K'))
246cd74dd17STomasz Miąsko     demangleConst();
247cd74dd17STomasz Miąsko   else
2482961f863STomasz Miąsko     demangleType();
249cd74dd17STomasz Miąsko   // FIXME demangle lifetimes.
2502961f863STomasz Miąsko }
2512961f863STomasz Miąsko 
2522961f863STomasz Miąsko // <basic-type> = "a"      // i8
2532961f863STomasz Miąsko //              | "b"      // bool
2542961f863STomasz Miąsko //              | "c"      // char
2552961f863STomasz Miąsko //              | "d"      // f64
2562961f863STomasz Miąsko //              | "e"      // str
2572961f863STomasz Miąsko //              | "f"      // f32
2582961f863STomasz Miąsko //              | "h"      // u8
2592961f863STomasz Miąsko //              | "i"      // isize
2602961f863STomasz Miąsko //              | "j"      // usize
2612961f863STomasz Miąsko //              | "l"      // i32
2622961f863STomasz Miąsko //              | "m"      // u32
2632961f863STomasz Miąsko //              | "n"      // i128
2642961f863STomasz Miąsko //              | "o"      // u128
2652961f863STomasz Miąsko //              | "s"      // i16
2662961f863STomasz Miąsko //              | "t"      // u16
2672961f863STomasz Miąsko //              | "u"      // ()
2682961f863STomasz Miąsko //              | "v"      // ...
2692961f863STomasz Miąsko //              | "x"      // i64
2702961f863STomasz Miąsko //              | "y"      // u64
2712961f863STomasz Miąsko //              | "z"      // !
2722961f863STomasz Miąsko //              | "p"      // placeholder (e.g. for generic params), shown as _
273cd74dd17STomasz Miąsko static bool parseBasicType(char C, BasicType &Type) {
274cd74dd17STomasz Miąsko   switch (C) {
275cd74dd17STomasz Miąsko   case 'a':
276cd74dd17STomasz Miąsko     Type = BasicType::I8;
277cd74dd17STomasz Miąsko     return true;
278cd74dd17STomasz Miąsko   case 'b':
279cd74dd17STomasz Miąsko     Type = BasicType::Bool;
280cd74dd17STomasz Miąsko     return true;
281cd74dd17STomasz Miąsko   case 'c':
282cd74dd17STomasz Miąsko     Type = BasicType::Char;
283cd74dd17STomasz Miąsko     return true;
284cd74dd17STomasz Miąsko   case 'd':
285cd74dd17STomasz Miąsko     Type = BasicType::F64;
286cd74dd17STomasz Miąsko     return true;
287cd74dd17STomasz Miąsko   case 'e':
288cd74dd17STomasz Miąsko     Type = BasicType::Str;
289cd74dd17STomasz Miąsko     return true;
290cd74dd17STomasz Miąsko   case 'f':
291cd74dd17STomasz Miąsko     Type = BasicType::F32;
292cd74dd17STomasz Miąsko     return true;
293cd74dd17STomasz Miąsko   case 'h':
294cd74dd17STomasz Miąsko     Type = BasicType::U8;
295cd74dd17STomasz Miąsko     return true;
296cd74dd17STomasz Miąsko   case 'i':
297cd74dd17STomasz Miąsko     Type = BasicType::ISize;
298cd74dd17STomasz Miąsko     return true;
299cd74dd17STomasz Miąsko   case 'j':
300cd74dd17STomasz Miąsko     Type = BasicType::USize;
301cd74dd17STomasz Miąsko     return true;
302cd74dd17STomasz Miąsko   case 'l':
303cd74dd17STomasz Miąsko     Type = BasicType::I32;
304cd74dd17STomasz Miąsko     return true;
305cd74dd17STomasz Miąsko   case 'm':
306cd74dd17STomasz Miąsko     Type = BasicType::U32;
307cd74dd17STomasz Miąsko     return true;
308cd74dd17STomasz Miąsko   case 'n':
309cd74dd17STomasz Miąsko     Type = BasicType::I128;
310cd74dd17STomasz Miąsko     return true;
311cd74dd17STomasz Miąsko   case 'o':
312cd74dd17STomasz Miąsko     Type = BasicType::U128;
313cd74dd17STomasz Miąsko     return true;
314cd74dd17STomasz Miąsko   case 'p':
315cd74dd17STomasz Miąsko     Type = BasicType::Placeholder;
316cd74dd17STomasz Miąsko     return true;
317cd74dd17STomasz Miąsko   case 's':
318cd74dd17STomasz Miąsko     Type = BasicType::I16;
319cd74dd17STomasz Miąsko     return true;
320cd74dd17STomasz Miąsko   case 't':
321cd74dd17STomasz Miąsko     Type = BasicType::U16;
322cd74dd17STomasz Miąsko     return true;
323cd74dd17STomasz Miąsko   case 'u':
324cd74dd17STomasz Miąsko     Type = BasicType::Unit;
325cd74dd17STomasz Miąsko     return true;
326cd74dd17STomasz Miąsko   case 'v':
327cd74dd17STomasz Miąsko     Type = BasicType::Variadic;
328cd74dd17STomasz Miąsko     return true;
329cd74dd17STomasz Miąsko   case 'x':
330cd74dd17STomasz Miąsko     Type = BasicType::I64;
331cd74dd17STomasz Miąsko     return true;
332cd74dd17STomasz Miąsko   case 'y':
333cd74dd17STomasz Miąsko     Type = BasicType::U64;
334cd74dd17STomasz Miąsko     return true;
335cd74dd17STomasz Miąsko   case 'z':
336cd74dd17STomasz Miąsko     Type = BasicType::Never;
337cd74dd17STomasz Miąsko     return true;
338cd74dd17STomasz Miąsko   default:
339cd74dd17STomasz Miąsko     return false;
340cd74dd17STomasz Miąsko   }
341cd74dd17STomasz Miąsko }
342cd74dd17STomasz Miąsko 
343cd74dd17STomasz Miąsko void Demangler::printBasicType(BasicType Type) {
344cd74dd17STomasz Miąsko   switch (Type) {
345cd74dd17STomasz Miąsko   case BasicType::Bool:
346cd74dd17STomasz Miąsko     print("bool");
347cd74dd17STomasz Miąsko     break;
348cd74dd17STomasz Miąsko   case BasicType::Char:
349cd74dd17STomasz Miąsko     print("char");
350cd74dd17STomasz Miąsko     break;
351cd74dd17STomasz Miąsko   case BasicType::I8:
352cd74dd17STomasz Miąsko     print("i8");
353cd74dd17STomasz Miąsko     break;
354cd74dd17STomasz Miąsko   case BasicType::I16:
355cd74dd17STomasz Miąsko     print("i16");
356cd74dd17STomasz Miąsko     break;
357cd74dd17STomasz Miąsko   case BasicType::I32:
358cd74dd17STomasz Miąsko     print("i32");
359cd74dd17STomasz Miąsko     break;
360cd74dd17STomasz Miąsko   case BasicType::I64:
361cd74dd17STomasz Miąsko     print("i64");
362cd74dd17STomasz Miąsko     break;
363cd74dd17STomasz Miąsko   case BasicType::I128:
364cd74dd17STomasz Miąsko     print("i128");
365cd74dd17STomasz Miąsko     break;
366cd74dd17STomasz Miąsko   case BasicType::ISize:
367cd74dd17STomasz Miąsko     print("isize");
368cd74dd17STomasz Miąsko     break;
369cd74dd17STomasz Miąsko   case BasicType::U8:
370cd74dd17STomasz Miąsko     print("u8");
371cd74dd17STomasz Miąsko     break;
372cd74dd17STomasz Miąsko   case BasicType::U16:
373cd74dd17STomasz Miąsko     print("u16");
374cd74dd17STomasz Miąsko     break;
375cd74dd17STomasz Miąsko   case BasicType::U32:
376cd74dd17STomasz Miąsko     print("u32");
377cd74dd17STomasz Miąsko     break;
378cd74dd17STomasz Miąsko   case BasicType::U64:
379cd74dd17STomasz Miąsko     print("u64");
380cd74dd17STomasz Miąsko     break;
381cd74dd17STomasz Miąsko   case BasicType::U128:
382cd74dd17STomasz Miąsko     print("u128");
383cd74dd17STomasz Miąsko     break;
384cd74dd17STomasz Miąsko   case BasicType::USize:
385cd74dd17STomasz Miąsko     print("usize");
386cd74dd17STomasz Miąsko     break;
387cd74dd17STomasz Miąsko   case BasicType::F32:
388cd74dd17STomasz Miąsko     print("f32");
389cd74dd17STomasz Miąsko     break;
390cd74dd17STomasz Miąsko   case BasicType::F64:
391cd74dd17STomasz Miąsko     print("f64");
392cd74dd17STomasz Miąsko     break;
393cd74dd17STomasz Miąsko   case BasicType::Str:
394cd74dd17STomasz Miąsko     print("str");
395cd74dd17STomasz Miąsko     break;
396cd74dd17STomasz Miąsko   case BasicType::Placeholder:
397cd74dd17STomasz Miąsko     print("_");
398cd74dd17STomasz Miąsko     break;
399cd74dd17STomasz Miąsko   case BasicType::Unit:
400cd74dd17STomasz Miąsko     print("()");
401cd74dd17STomasz Miąsko     break;
402cd74dd17STomasz Miąsko   case BasicType::Variadic:
403cd74dd17STomasz Miąsko     print("...");
404cd74dd17STomasz Miąsko     break;
405cd74dd17STomasz Miąsko   case BasicType::Never:
406cd74dd17STomasz Miąsko     print("!");
407cd74dd17STomasz Miąsko     break;
408cd74dd17STomasz Miąsko   }
4092961f863STomasz Miąsko }
4102961f863STomasz Miąsko 
4112961f863STomasz Miąsko // <type> = | <basic-type>
4122961f863STomasz Miąsko //          | <path>                      // named type
4132961f863STomasz Miąsko //          | "A" <type> <const>          // [T; N]
4142961f863STomasz Miąsko //          | "S" <type>                  // [T]
4152961f863STomasz Miąsko //          | "T" {<type>} "E"            // (T1, T2, T3, ...)
4162961f863STomasz Miąsko //          | "R" [<lifetime>] <type>     // &T
4172961f863STomasz Miąsko //          | "Q" [<lifetime>] <type>     // &mut T
4182961f863STomasz Miąsko //          | "P" <type>                  // *const T
4192961f863STomasz Miąsko //          | "O" <type>                  // *mut T
4202961f863STomasz Miąsko //          | "F" <fn-sig>                // fn(...) -> ...
4212961f863STomasz Miąsko //          | "D" <dyn-bounds> <lifetime> // dyn Trait<Assoc = X> + Send + 'a
4222961f863STomasz Miąsko //          | <backref>                   // backref
4232961f863STomasz Miąsko void Demangler::demangleType() {
424b42400ccSTomasz Miąsko   size_t Start = Position;
42506833297STomasz Miąsko 
426b42400ccSTomasz Miąsko   char C = consume();
427b42400ccSTomasz Miąsko   BasicType Type;
428b42400ccSTomasz Miąsko   if (parseBasicType(C, Type))
429b42400ccSTomasz Miąsko     return printBasicType(Type);
430b42400ccSTomasz Miąsko 
431b42400ccSTomasz Miąsko   switch (C) {
432b42400ccSTomasz Miąsko   case 'A':
433b42400ccSTomasz Miąsko     print("[");
434b42400ccSTomasz Miąsko     demangleType();
435b42400ccSTomasz Miąsko     print("; ");
436b42400ccSTomasz Miąsko     demangleConst();
437b42400ccSTomasz Miąsko     print("]");
438b42400ccSTomasz Miąsko     break;
439a84c65c2STomasz Miąsko   case 'S':
440a84c65c2STomasz Miąsko     print("[");
441a84c65c2STomasz Miąsko     demangleType();
442a84c65c2STomasz Miąsko     print("]");
443a84c65c2STomasz Miąsko     break;
444774de7a0STomasz Miąsko   case 'T': {
445774de7a0STomasz Miąsko     print("(");
446774de7a0STomasz Miąsko     size_t I = 0;
447774de7a0STomasz Miąsko     for (; !Error && !consumeIf('E'); ++I) {
448774de7a0STomasz Miąsko       if (I > 0)
449774de7a0STomasz Miąsko         print(", ");
450774de7a0STomasz Miąsko       demangleType();
451774de7a0STomasz Miąsko     }
452774de7a0STomasz Miąsko     if (I == 1)
453774de7a0STomasz Miąsko       print(",");
454774de7a0STomasz Miąsko     print(")");
455774de7a0STomasz Miąsko     break;
456774de7a0STomasz Miąsko   }
457*e4fa6c95STomasz Miąsko   case 'R':
458*e4fa6c95STomasz Miąsko     print("&");
459*e4fa6c95STomasz Miąsko     // FIXME demangle [<lifetime>].
460*e4fa6c95STomasz Miąsko     demangleType();
461*e4fa6c95STomasz Miąsko     break;
462*e4fa6c95STomasz Miąsko   case 'Q':
463*e4fa6c95STomasz Miąsko     print("&mut ");
464*e4fa6c95STomasz Miąsko     // FIXME demangle [<lifetime>].
465*e4fa6c95STomasz Miąsko     demangleType();
466*e4fa6c95STomasz Miąsko     break;
4676aac5633STomasz Miąsko   case 'P':
4686aac5633STomasz Miąsko     print("*const ");
4696aac5633STomasz Miąsko     demangleType();
4706aac5633STomasz Miąsko     break;
4716aac5633STomasz Miąsko   case 'O':
4726aac5633STomasz Miąsko     print("*mut ");
4736aac5633STomasz Miąsko     demangleType();
4746aac5633STomasz Miąsko     break;
475b42400ccSTomasz Miąsko   default:
476b42400ccSTomasz Miąsko     Position = Start;
47757f40886STomasz Miąsko     demanglePath(rust_demangle::InType::Yes);
478b42400ccSTomasz Miąsko     break;
479b42400ccSTomasz Miąsko   }
480cd74dd17STomasz Miąsko }
481cd74dd17STomasz Miąsko 
482cd74dd17STomasz Miąsko // <const> = <basic-type> <const-data>
483cd74dd17STomasz Miąsko //         | "p"                          // placeholder
484cd74dd17STomasz Miąsko //         | <backref>
485cd74dd17STomasz Miąsko void Demangler::demangleConst() {
486cd74dd17STomasz Miąsko   BasicType Type;
487cd74dd17STomasz Miąsko   if (parseBasicType(consume(), Type)) {
488cd74dd17STomasz Miąsko     switch (Type) {
489cd74dd17STomasz Miąsko     case BasicType::I8:
490cd74dd17STomasz Miąsko     case BasicType::I16:
491cd74dd17STomasz Miąsko     case BasicType::I32:
492cd74dd17STomasz Miąsko     case BasicType::I64:
493cd74dd17STomasz Miąsko     case BasicType::I128:
494cd74dd17STomasz Miąsko     case BasicType::ISize:
495cd74dd17STomasz Miąsko     case BasicType::U8:
496cd74dd17STomasz Miąsko     case BasicType::U16:
497cd74dd17STomasz Miąsko     case BasicType::U32:
498cd74dd17STomasz Miąsko     case BasicType::U64:
499cd74dd17STomasz Miąsko     case BasicType::U128:
500cd74dd17STomasz Miąsko     case BasicType::USize:
501cd74dd17STomasz Miąsko       demangleConstInt();
502cd74dd17STomasz Miąsko       break;
503fc0f2bb9STomasz Miąsko     case BasicType::Bool:
504fc0f2bb9STomasz Miąsko       demangleConstBool();
505fc0f2bb9STomasz Miąsko       break;
5062ba49f6aSTomasz Miąsko     case BasicType::Char:
5072ba49f6aSTomasz Miąsko       demangleConstChar();
5082ba49f6aSTomasz Miąsko       break;
509cd74dd17STomasz Miąsko     case BasicType::Placeholder:
510cd74dd17STomasz Miąsko       print('_');
511cd74dd17STomasz Miąsko       break;
512cd74dd17STomasz Miąsko     default:
5132ba49f6aSTomasz Miąsko       // FIXME demangle backreferences.
5142961f863STomasz Miąsko       Error = true;
515cd74dd17STomasz Miąsko       break;
516cd74dd17STomasz Miąsko     }
517cd74dd17STomasz Miąsko   } else {
518cd74dd17STomasz Miąsko     Error = true;
519cd74dd17STomasz Miąsko   }
520cd74dd17STomasz Miąsko }
521cd74dd17STomasz Miąsko 
522cd74dd17STomasz Miąsko // <const-data> = ["n"] <hex-number>
523cd74dd17STomasz Miąsko void Demangler::demangleConstInt() {
524cd74dd17STomasz Miąsko   if (consumeIf('n'))
525cd74dd17STomasz Miąsko     print('-');
526cd74dd17STomasz Miąsko 
527cd74dd17STomasz Miąsko   StringView HexDigits;
528cd74dd17STomasz Miąsko   uint64_t Value = parseHexNumber(HexDigits);
529cd74dd17STomasz Miąsko   if (HexDigits.size() <= 16) {
530cd74dd17STomasz Miąsko     printDecimalNumber(Value);
531cd74dd17STomasz Miąsko   } else {
532cd74dd17STomasz Miąsko     print("0x");
533cd74dd17STomasz Miąsko     print(HexDigits);
5342961f863STomasz Miąsko   }
5352961f863STomasz Miąsko }
5362961f863STomasz Miąsko 
537fc0f2bb9STomasz Miąsko // <const-data> = "0_" // false
538fc0f2bb9STomasz Miąsko //              | "1_" // true
539fc0f2bb9STomasz Miąsko void Demangler::demangleConstBool() {
540fc0f2bb9STomasz Miąsko   StringView HexDigits;
541fc0f2bb9STomasz Miąsko   parseHexNumber(HexDigits);
542fc0f2bb9STomasz Miąsko   if (HexDigits == "0")
543fc0f2bb9STomasz Miąsko     print("false");
544fc0f2bb9STomasz Miąsko   else if (HexDigits == "1")
545fc0f2bb9STomasz Miąsko     print("true");
546fc0f2bb9STomasz Miąsko   else
547fc0f2bb9STomasz Miąsko     Error = true;
548fc0f2bb9STomasz Miąsko }
549fc0f2bb9STomasz Miąsko 
5502ba49f6aSTomasz Miąsko /// Returns true if CodePoint represents a printable ASCII character.
5512ba49f6aSTomasz Miąsko static bool isAsciiPrintable(uint64_t CodePoint) {
5522ba49f6aSTomasz Miąsko   return 0x20 <= CodePoint && CodePoint <= 0x7e;
5532ba49f6aSTomasz Miąsko }
5542ba49f6aSTomasz Miąsko 
5552ba49f6aSTomasz Miąsko // <const-data> = <hex-number>
5562ba49f6aSTomasz Miąsko void Demangler::demangleConstChar() {
5572ba49f6aSTomasz Miąsko   StringView HexDigits;
5582ba49f6aSTomasz Miąsko   uint64_t CodePoint = parseHexNumber(HexDigits);
5592ba49f6aSTomasz Miąsko   if (Error || HexDigits.size() > 6) {
5602ba49f6aSTomasz Miąsko     Error = true;
5612ba49f6aSTomasz Miąsko     return;
5622ba49f6aSTomasz Miąsko   }
5632ba49f6aSTomasz Miąsko 
5642ba49f6aSTomasz Miąsko   print("'");
5652ba49f6aSTomasz Miąsko   switch (CodePoint) {
5662ba49f6aSTomasz Miąsko   case '\t':
5672ba49f6aSTomasz Miąsko     print(R"(\t)");
5682ba49f6aSTomasz Miąsko     break;
5692ba49f6aSTomasz Miąsko   case '\r':
5702ba49f6aSTomasz Miąsko     print(R"(\r)");
5712ba49f6aSTomasz Miąsko     break;
5722ba49f6aSTomasz Miąsko   case '\n':
5732ba49f6aSTomasz Miąsko     print(R"(\n)");
5742ba49f6aSTomasz Miąsko     break;
5752ba49f6aSTomasz Miąsko   case '\\':
5762ba49f6aSTomasz Miąsko     print(R"(\\)");
5772ba49f6aSTomasz Miąsko     break;
5782ba49f6aSTomasz Miąsko   case '"':
5792ba49f6aSTomasz Miąsko     print(R"(")");
5802ba49f6aSTomasz Miąsko     break;
5812ba49f6aSTomasz Miąsko   case '\'':
5822ba49f6aSTomasz Miąsko     print(R"(\')");
5832ba49f6aSTomasz Miąsko     break;
5842ba49f6aSTomasz Miąsko   default:
5852ba49f6aSTomasz Miąsko     if (isAsciiPrintable(CodePoint)) {
5862ba49f6aSTomasz Miąsko       char C = CodePoint;
5872ba49f6aSTomasz Miąsko       print(C);
5882ba49f6aSTomasz Miąsko     } else {
5892ba49f6aSTomasz Miąsko       print(R"(\u{)");
5902ba49f6aSTomasz Miąsko       print(HexDigits);
5912ba49f6aSTomasz Miąsko       print('}');
5922ba49f6aSTomasz Miąsko     }
5932ba49f6aSTomasz Miąsko     break;
5942ba49f6aSTomasz Miąsko   }
5952ba49f6aSTomasz Miąsko   print('\'');
5962ba49f6aSTomasz Miąsko }
5972ba49f6aSTomasz Miąsko 
5987310403eSTomasz Miąsko // <undisambiguated-identifier> = ["u"] <decimal-number> ["_"] <bytes>
5997310403eSTomasz Miąsko Identifier Demangler::parseIdentifier() {
6007310403eSTomasz Miąsko   bool Punycode = consumeIf('u');
6017310403eSTomasz Miąsko   uint64_t Bytes = parseDecimalNumber();
6027310403eSTomasz Miąsko 
6037310403eSTomasz Miąsko   // Underscore resolves the ambiguity when identifier starts with a decimal
6047310403eSTomasz Miąsko   // digit or another underscore.
6057310403eSTomasz Miąsko   consumeIf('_');
6067310403eSTomasz Miąsko 
6077310403eSTomasz Miąsko   if (Error || Bytes > Input.size() - Position) {
6087310403eSTomasz Miąsko     Error = true;
6097310403eSTomasz Miąsko     return {};
6107310403eSTomasz Miąsko   }
6117310403eSTomasz Miąsko   StringView S = Input.substr(Position, Bytes);
6127310403eSTomasz Miąsko   Position += Bytes;
6137310403eSTomasz Miąsko 
6147310403eSTomasz Miąsko   if (!std::all_of(S.begin(), S.end(), isValid)) {
6157310403eSTomasz Miąsko     Error = true;
6167310403eSTomasz Miąsko     return {};
6177310403eSTomasz Miąsko   }
6187310403eSTomasz Miąsko 
6197310403eSTomasz Miąsko   return {S, Punycode};
6207310403eSTomasz Miąsko }
6217310403eSTomasz Miąsko 
6227310403eSTomasz Miąsko // Parses optional base 62 number. The presence of a number is determined using
62378e94915STomasz Miąsko // Tag. Returns 0 when tag is absent and parsed value + 1 otherwise.
62478e94915STomasz Miąsko uint64_t Demangler::parseOptionalBase62Number(char Tag) {
62578e94915STomasz Miąsko   if (!consumeIf(Tag))
62678e94915STomasz Miąsko     return 0;
62778e94915STomasz Miąsko 
62878e94915STomasz Miąsko   uint64_t N = parseBase62Number();
62978e94915STomasz Miąsko   if (Error || !addAssign(N, 1))
63078e94915STomasz Miąsko     return 0;
63178e94915STomasz Miąsko 
63278e94915STomasz Miąsko   return N;
6337310403eSTomasz Miąsko }
6347310403eSTomasz Miąsko 
6357310403eSTomasz Miąsko // Parses base 62 number with <0-9a-zA-Z> as digits. Number is terminated by
6367310403eSTomasz Miąsko // "_". All values are offset by 1, so that "_" encodes 0, "0_" encodes 1,
6377310403eSTomasz Miąsko // "1_" encodes 2, etc.
6387310403eSTomasz Miąsko //
6397310403eSTomasz Miąsko // <base-62-number> = {<0-9a-zA-Z>} "_"
6407310403eSTomasz Miąsko uint64_t Demangler::parseBase62Number() {
6417310403eSTomasz Miąsko   if (consumeIf('_'))
6427310403eSTomasz Miąsko     return 0;
6437310403eSTomasz Miąsko 
6447310403eSTomasz Miąsko   uint64_t Value = 0;
6457310403eSTomasz Miąsko 
6467310403eSTomasz Miąsko   while (true) {
6477310403eSTomasz Miąsko     uint64_t Digit;
6487310403eSTomasz Miąsko     char C = consume();
6497310403eSTomasz Miąsko 
6507310403eSTomasz Miąsko     if (C == '_') {
6517310403eSTomasz Miąsko       break;
6527310403eSTomasz Miąsko     } else if (isDigit(C)) {
6537310403eSTomasz Miąsko       Digit = C - '0';
6547310403eSTomasz Miąsko     } else if (isLower(C)) {
6557310403eSTomasz Miąsko       Digit = 10 + (C - 'a');
6567310403eSTomasz Miąsko     } else if (isUpper(C)) {
6577310403eSTomasz Miąsko       Digit = 10 + 26 + (C - 'A');
6587310403eSTomasz Miąsko     } else {
6597310403eSTomasz Miąsko       Error = true;
6607310403eSTomasz Miąsko       return 0;
6617310403eSTomasz Miąsko     }
6627310403eSTomasz Miąsko 
6637310403eSTomasz Miąsko     if (!mulAssign(Value, 62))
6647310403eSTomasz Miąsko       return 0;
6657310403eSTomasz Miąsko 
6667310403eSTomasz Miąsko     if (!addAssign(Value, Digit))
6677310403eSTomasz Miąsko       return 0;
6687310403eSTomasz Miąsko   }
6697310403eSTomasz Miąsko 
6707310403eSTomasz Miąsko   if (!addAssign(Value, 1))
6717310403eSTomasz Miąsko     return 0;
6727310403eSTomasz Miąsko 
6737310403eSTomasz Miąsko   return Value;
6747310403eSTomasz Miąsko }
6757310403eSTomasz Miąsko 
6767310403eSTomasz Miąsko // Parses a decimal number that had been encoded without any leading zeros.
6777310403eSTomasz Miąsko //
6787310403eSTomasz Miąsko // <decimal-number> = "0"
6797310403eSTomasz Miąsko //                  | <1-9> {<0-9>}
6807310403eSTomasz Miąsko uint64_t Demangler::parseDecimalNumber() {
6817310403eSTomasz Miąsko   char C = look();
6827310403eSTomasz Miąsko   if (!isDigit(C)) {
6837310403eSTomasz Miąsko     Error = true;
6847310403eSTomasz Miąsko     return 0;
6857310403eSTomasz Miąsko   }
6867310403eSTomasz Miąsko 
6877310403eSTomasz Miąsko   if (C == '0') {
6887310403eSTomasz Miąsko     consume();
6897310403eSTomasz Miąsko     return 0;
6907310403eSTomasz Miąsko   }
6917310403eSTomasz Miąsko 
6927310403eSTomasz Miąsko   uint64_t Value = 0;
6937310403eSTomasz Miąsko 
6947310403eSTomasz Miąsko   while (isDigit(look())) {
6957310403eSTomasz Miąsko     if (!mulAssign(Value, 10)) {
6967310403eSTomasz Miąsko       Error = true;
6977310403eSTomasz Miąsko       return 0;
6987310403eSTomasz Miąsko     }
6997310403eSTomasz Miąsko 
7007310403eSTomasz Miąsko     uint64_t D = consume() - '0';
7017310403eSTomasz Miąsko     if (!addAssign(Value, D))
7027310403eSTomasz Miąsko       return 0;
7037310403eSTomasz Miąsko   }
7047310403eSTomasz Miąsko 
7057310403eSTomasz Miąsko   return Value;
7067310403eSTomasz Miąsko }
707cd74dd17STomasz Miąsko 
708cd74dd17STomasz Miąsko // Parses a hexadecimal number with <0-9a-f> as a digits. Returns the parsed
709cd74dd17STomasz Miąsko // value and stores hex digits in HexDigits. The return value is unspecified if
710cd74dd17STomasz Miąsko // HexDigits.size() > 16.
711cd74dd17STomasz Miąsko //
712cd74dd17STomasz Miąsko // <hex-number> = "0_"
713cd74dd17STomasz Miąsko //              | <1-9a-f> {<0-9a-f>} "_"
714cd74dd17STomasz Miąsko uint64_t Demangler::parseHexNumber(StringView &HexDigits) {
715cd74dd17STomasz Miąsko   size_t Start = Position;
716cd74dd17STomasz Miąsko   uint64_t Value = 0;
717cd74dd17STomasz Miąsko 
718cd74dd17STomasz Miąsko   if (!isHexDigit(look()))
719cd74dd17STomasz Miąsko     Error = true;
720cd74dd17STomasz Miąsko 
721cd74dd17STomasz Miąsko   if (consumeIf('0')) {
722cd74dd17STomasz Miąsko     if (!consumeIf('_'))
723cd74dd17STomasz Miąsko       Error = true;
724cd74dd17STomasz Miąsko   } else {
725cd74dd17STomasz Miąsko     while (!Error && !consumeIf('_')) {
726cd74dd17STomasz Miąsko       char C = consume();
727cd74dd17STomasz Miąsko       Value *= 16;
728cd74dd17STomasz Miąsko       if (isDigit(C))
729cd74dd17STomasz Miąsko         Value += C - '0';
730cd74dd17STomasz Miąsko       else if ('a' <= C && C <= 'f')
731cd74dd17STomasz Miąsko         Value += 10 + (C - 'a');
732cd74dd17STomasz Miąsko       else
733cd74dd17STomasz Miąsko         Error = true;
734cd74dd17STomasz Miąsko     }
735cd74dd17STomasz Miąsko   }
736cd74dd17STomasz Miąsko 
737cd74dd17STomasz Miąsko   if (Error) {
738cd74dd17STomasz Miąsko     HexDigits = StringView();
739cd74dd17STomasz Miąsko     return 0;
740cd74dd17STomasz Miąsko   }
741cd74dd17STomasz Miąsko 
742cd74dd17STomasz Miąsko   size_t End = Position - 1;
743cd74dd17STomasz Miąsko   assert(Start < End);
744cd74dd17STomasz Miąsko   HexDigits = Input.substr(Start, End - Start);
745cd74dd17STomasz Miąsko   return Value;
746cd74dd17STomasz Miąsko }
747