17310403eSTomasz Miąsko //===--- RustDemangle.cpp ---------------------------------------*- C++ -*-===// 27310403eSTomasz Miąsko // 37310403eSTomasz Miąsko // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions. 47310403eSTomasz Miąsko // See https://llvm.org/LICENSE.txt for license information. 57310403eSTomasz Miąsko // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception 67310403eSTomasz Miąsko // 77310403eSTomasz Miąsko //===----------------------------------------------------------------------===// 87310403eSTomasz Miąsko // 97310403eSTomasz Miąsko // This file defines a demangler for Rust v0 mangled symbols as specified in 107310403eSTomasz Miąsko // https://rust-lang.github.io/rfcs/2603-rust-symbol-name-mangling-v0.html 117310403eSTomasz Miąsko // 127310403eSTomasz Miąsko //===----------------------------------------------------------------------===// 137310403eSTomasz Miąsko 147310403eSTomasz Miąsko #include "llvm/Demangle/RustDemangle.h" 157310403eSTomasz Miąsko #include "llvm/Demangle/Demangle.h" 167310403eSTomasz Miąsko 177310403eSTomasz Miąsko #include <algorithm> 187310403eSTomasz Miąsko #include <cassert> 197310403eSTomasz Miąsko #include <cstring> 207310403eSTomasz Miąsko #include <limits> 217310403eSTomasz Miąsko 227310403eSTomasz Miąsko using namespace llvm; 237310403eSTomasz Miąsko using namespace rust_demangle; 247310403eSTomasz Miąsko 257310403eSTomasz Miąsko char *llvm::rustDemangle(const char *MangledName, char *Buf, size_t *N, 267310403eSTomasz Miąsko int *Status) { 277310403eSTomasz Miąsko if (MangledName == nullptr || (Buf != nullptr && N == nullptr)) { 287310403eSTomasz Miąsko if (Status != nullptr) 297310403eSTomasz Miąsko *Status = demangle_invalid_args; 307310403eSTomasz Miąsko return nullptr; 317310403eSTomasz Miąsko } 327310403eSTomasz Miąsko 337310403eSTomasz Miąsko // Return early if mangled name doesn't look like a Rust symbol. 347310403eSTomasz Miąsko StringView Mangled(MangledName); 357310403eSTomasz Miąsko if (!Mangled.startsWith("_R")) { 367310403eSTomasz Miąsko if (Status != nullptr) 377310403eSTomasz Miąsko *Status = demangle_invalid_mangled_name; 387310403eSTomasz Miąsko return nullptr; 397310403eSTomasz Miąsko } 407310403eSTomasz Miąsko 417310403eSTomasz Miąsko Demangler D; 427310403eSTomasz Miąsko if (!initializeOutputStream(nullptr, nullptr, D.Output, 1024)) { 437310403eSTomasz Miąsko if (Status != nullptr) 447310403eSTomasz Miąsko *Status = demangle_memory_alloc_failure; 457310403eSTomasz Miąsko return nullptr; 467310403eSTomasz Miąsko } 477310403eSTomasz Miąsko 487310403eSTomasz Miąsko if (!D.demangle(Mangled)) { 497310403eSTomasz Miąsko if (Status != nullptr) 507310403eSTomasz Miąsko *Status = demangle_invalid_mangled_name; 517310403eSTomasz Miąsko std::free(D.Output.getBuffer()); 527310403eSTomasz Miąsko return nullptr; 537310403eSTomasz Miąsko } 547310403eSTomasz Miąsko 557310403eSTomasz Miąsko D.Output += '\0'; 567310403eSTomasz Miąsko char *Demangled = D.Output.getBuffer(); 577310403eSTomasz Miąsko size_t DemangledLen = D.Output.getCurrentPosition(); 587310403eSTomasz Miąsko 597310403eSTomasz Miąsko if (Buf != nullptr) { 607310403eSTomasz Miąsko if (DemangledLen <= *N) { 617310403eSTomasz Miąsko std::memcpy(Buf, Demangled, DemangledLen); 627310403eSTomasz Miąsko std::free(Demangled); 637310403eSTomasz Miąsko Demangled = Buf; 647310403eSTomasz Miąsko } else { 657310403eSTomasz Miąsko std::free(Buf); 667310403eSTomasz Miąsko } 677310403eSTomasz Miąsko } 687310403eSTomasz Miąsko 697310403eSTomasz Miąsko if (N != nullptr) 707310403eSTomasz Miąsko *N = DemangledLen; 717310403eSTomasz Miąsko 727310403eSTomasz Miąsko if (Status != nullptr) 737310403eSTomasz Miąsko *Status = demangle_success; 747310403eSTomasz Miąsko 757310403eSTomasz Miąsko return Demangled; 767310403eSTomasz Miąsko } 777310403eSTomasz Miąsko 787310403eSTomasz Miąsko Demangler::Demangler(size_t MaxRecursionLevel) 797310403eSTomasz Miąsko : MaxRecursionLevel(MaxRecursionLevel) {} 807310403eSTomasz Miąsko 817310403eSTomasz Miąsko static inline bool isDigit(const char C) { return '0' <= C && C <= '9'; } 827310403eSTomasz Miąsko 83cd74dd17STomasz Miąsko static inline bool isHexDigit(const char C) { 84cd74dd17STomasz Miąsko return ('0' <= C && C <= '9') || ('a' <= C && C <= 'f'); 85cd74dd17STomasz Miąsko } 86cd74dd17STomasz Miąsko 877310403eSTomasz Miąsko static inline bool isLower(const char C) { return 'a' <= C && C <= 'z'; } 887310403eSTomasz Miąsko 897310403eSTomasz Miąsko static inline bool isUpper(const char C) { return 'A' <= C && C <= 'Z'; } 907310403eSTomasz Miąsko 917310403eSTomasz Miąsko /// Returns true if C is a valid mangled character: <0-9a-zA-Z_>. 927310403eSTomasz Miąsko static inline bool isValid(const char C) { 937310403eSTomasz Miąsko return isDigit(C) || isLower(C) || isUpper(C) || C == '_'; 947310403eSTomasz Miąsko } 957310403eSTomasz Miąsko 967310403eSTomasz Miąsko // Demangles Rust v0 mangled symbol. Returns true when successful, and false 977310403eSTomasz Miąsko // otherwise. The demangled symbol is stored in Output field. It is 987310403eSTomasz Miąsko // responsibility of the caller to free the memory behind the output stream. 997310403eSTomasz Miąsko // 1007310403eSTomasz Miąsko // <symbol-name> = "_R" <path> [<instantiating-crate>] 1017310403eSTomasz Miąsko bool Demangler::demangle(StringView Mangled) { 1027310403eSTomasz Miąsko Position = 0; 1037310403eSTomasz Miąsko Error = false; 104f0f2a8b2STomasz Miąsko Print = true; 1057310403eSTomasz Miąsko RecursionLevel = 0; 1067310403eSTomasz Miąsko 1077310403eSTomasz Miąsko if (!Mangled.consumeFront("_R")) { 1087310403eSTomasz Miąsko Error = true; 1097310403eSTomasz Miąsko return false; 1107310403eSTomasz Miąsko } 1117310403eSTomasz Miąsko Input = Mangled; 1127310403eSTomasz Miąsko 11357f40886STomasz Miąsko demanglePath(rust_demangle::InType::No); 1147310403eSTomasz Miąsko 1157310403eSTomasz Miąsko // FIXME parse optional <instantiating-crate>. 1167310403eSTomasz Miąsko 1177310403eSTomasz Miąsko if (Position != Input.size()) 1187310403eSTomasz Miąsko Error = true; 1197310403eSTomasz Miąsko 1207310403eSTomasz Miąsko return !Error; 1217310403eSTomasz Miąsko } 1227310403eSTomasz Miąsko 12306833297STomasz Miąsko // Demangles a path. InType indicates whether a path is inside a type. 12406833297STomasz Miąsko // 1257310403eSTomasz Miąsko // <path> = "C" <identifier> // crate root 1267310403eSTomasz Miąsko // | "M" <impl-path> <type> // <T> (inherent impl) 1277310403eSTomasz Miąsko // | "X" <impl-path> <type> <path> // <T as Trait> (trait impl) 1287310403eSTomasz Miąsko // | "Y" <type> <path> // <T as Trait> (trait definition) 1297310403eSTomasz Miąsko // | "N" <ns> <path> <identifier> // ...::ident (nested path) 1307310403eSTomasz Miąsko // | "I" <path> {<generic-arg>} "E" // ...<T, U> (generic args) 1317310403eSTomasz Miąsko // | <backref> 1327310403eSTomasz Miąsko // <identifier> = [<disambiguator>] <undisambiguated-identifier> 1337310403eSTomasz Miąsko // <ns> = "C" // closure 1347310403eSTomasz Miąsko // | "S" // shim 1357310403eSTomasz Miąsko // | <A-Z> // other special namespaces 1367310403eSTomasz Miąsko // | <a-z> // internal namespaces 13706833297STomasz Miąsko void Demangler::demanglePath(InType InType) { 1387310403eSTomasz Miąsko if (Error || RecursionLevel >= MaxRecursionLevel) { 1397310403eSTomasz Miąsko Error = true; 1407310403eSTomasz Miąsko return; 1417310403eSTomasz Miąsko } 14278e94915STomasz Miąsko SwapAndRestore<size_t> SaveRecursionLevel(RecursionLevel, RecursionLevel + 1); 1437310403eSTomasz Miąsko 1447310403eSTomasz Miąsko switch (consume()) { 1457310403eSTomasz Miąsko case 'C': { 1467310403eSTomasz Miąsko parseOptionalBase62Number('s'); 1477310403eSTomasz Miąsko Identifier Ident = parseIdentifier(); 1487310403eSTomasz Miąsko print(Ident.Name); 1497310403eSTomasz Miąsko break; 1507310403eSTomasz Miąsko } 151f0f2a8b2STomasz Miąsko case 'M': { 15206833297STomasz Miąsko demangleImplPath(InType); 153f0f2a8b2STomasz Miąsko print("<"); 154f0f2a8b2STomasz Miąsko demangleType(); 155f0f2a8b2STomasz Miąsko print(">"); 156f0f2a8b2STomasz Miąsko break; 157f0f2a8b2STomasz Miąsko } 1589fa13800STomasz Miąsko case 'X': { 15906833297STomasz Miąsko demangleImplPath(InType); 1609fa13800STomasz Miąsko print("<"); 1619fa13800STomasz Miąsko demangleType(); 1629fa13800STomasz Miąsko print(" as "); 16357f40886STomasz Miąsko demanglePath(rust_demangle::InType::Yes); 1649fa13800STomasz Miąsko print(">"); 1659fa13800STomasz Miąsko break; 1669fa13800STomasz Miąsko } 167f933f7fbSTomasz Miąsko case 'Y': { 168f933f7fbSTomasz Miąsko print("<"); 169f933f7fbSTomasz Miąsko demangleType(); 170f933f7fbSTomasz Miąsko print(" as "); 17157f40886STomasz Miąsko demanglePath(rust_demangle::InType::Yes); 172f933f7fbSTomasz Miąsko print(">"); 173f933f7fbSTomasz Miąsko break; 174f933f7fbSTomasz Miąsko } 1757310403eSTomasz Miąsko case 'N': { 1767310403eSTomasz Miąsko char NS = consume(); 1777310403eSTomasz Miąsko if (!isLower(NS) && !isUpper(NS)) { 1787310403eSTomasz Miąsko Error = true; 1797310403eSTomasz Miąsko break; 1807310403eSTomasz Miąsko } 18106833297STomasz Miąsko demanglePath(InType); 1827310403eSTomasz Miąsko 18378e94915STomasz Miąsko uint64_t Disambiguator = parseOptionalBase62Number('s'); 1847310403eSTomasz Miąsko Identifier Ident = parseIdentifier(); 1857310403eSTomasz Miąsko 18678e94915STomasz Miąsko if (isUpper(NS)) { 18778e94915STomasz Miąsko // Special namespaces 18878e94915STomasz Miąsko print("::{"); 18978e94915STomasz Miąsko if (NS == 'C') 19078e94915STomasz Miąsko print("closure"); 19178e94915STomasz Miąsko else if (NS == 'S') 19278e94915STomasz Miąsko print("shim"); 19378e94915STomasz Miąsko else 19478e94915STomasz Miąsko print(NS); 1957310403eSTomasz Miąsko if (!Ident.empty()) { 19678e94915STomasz Miąsko print(":"); 19778e94915STomasz Miąsko print(Ident.Name); 19878e94915STomasz Miąsko } 19978e94915STomasz Miąsko print('#'); 20078e94915STomasz Miąsko printDecimalNumber(Disambiguator); 20178e94915STomasz Miąsko print('}'); 20278e94915STomasz Miąsko } else { 20378e94915STomasz Miąsko // Implementation internal namespaces. 20478e94915STomasz Miąsko if (!Ident.empty()) { 2057310403eSTomasz Miąsko print("::"); 2067310403eSTomasz Miąsko print(Ident.Name); 2077310403eSTomasz Miąsko } 20878e94915STomasz Miąsko } 2097310403eSTomasz Miąsko break; 2107310403eSTomasz Miąsko } 2112961f863STomasz Miąsko case 'I': { 21206833297STomasz Miąsko demanglePath(InType); 21306833297STomasz Miąsko // Omit "::" when in a type, where it is optional. 21457f40886STomasz Miąsko if (InType == rust_demangle::InType::No) 21506833297STomasz Miąsko print("::"); 21606833297STomasz Miąsko print("<"); 2172961f863STomasz Miąsko for (size_t I = 0; !Error && !consumeIf('E'); ++I) { 2182961f863STomasz Miąsko if (I > 0) 2192961f863STomasz Miąsko print(", "); 2202961f863STomasz Miąsko demangleGenericArg(); 2212961f863STomasz Miąsko } 2222961f863STomasz Miąsko print(">"); 2232961f863STomasz Miąsko break; 2242961f863STomasz Miąsko } 2257310403eSTomasz Miąsko default: 2267310403eSTomasz Miąsko // FIXME parse remaining productions. 2277310403eSTomasz Miąsko Error = true; 2287310403eSTomasz Miąsko break; 2297310403eSTomasz Miąsko } 2307310403eSTomasz Miąsko } 2317310403eSTomasz Miąsko 232f0f2a8b2STomasz Miąsko // <impl-path> = [<disambiguator>] <path> 233f0f2a8b2STomasz Miąsko // <disambiguator> = "s" <base-62-number> 23406833297STomasz Miąsko void Demangler::demangleImplPath(InType InType) { 235f0f2a8b2STomasz Miąsko SwapAndRestore<bool> SavePrint(Print, false); 236f0f2a8b2STomasz Miąsko parseOptionalBase62Number('s'); 23706833297STomasz Miąsko demanglePath(InType); 238f0f2a8b2STomasz Miąsko } 239f0f2a8b2STomasz Miąsko 2402961f863STomasz Miąsko // <generic-arg> = <lifetime> 2412961f863STomasz Miąsko // | <type> 2422961f863STomasz Miąsko // | "K" <const> 2432961f863STomasz Miąsko // <lifetime> = "L" <base-62-number> 2442961f863STomasz Miąsko void Demangler::demangleGenericArg() { 245cd74dd17STomasz Miąsko if (consumeIf('K')) 246cd74dd17STomasz Miąsko demangleConst(); 247cd74dd17STomasz Miąsko else 2482961f863STomasz Miąsko demangleType(); 249cd74dd17STomasz Miąsko // FIXME demangle lifetimes. 2502961f863STomasz Miąsko } 2512961f863STomasz Miąsko 2522961f863STomasz Miąsko // <basic-type> = "a" // i8 2532961f863STomasz Miąsko // | "b" // bool 2542961f863STomasz Miąsko // | "c" // char 2552961f863STomasz Miąsko // | "d" // f64 2562961f863STomasz Miąsko // | "e" // str 2572961f863STomasz Miąsko // | "f" // f32 2582961f863STomasz Miąsko // | "h" // u8 2592961f863STomasz Miąsko // | "i" // isize 2602961f863STomasz Miąsko // | "j" // usize 2612961f863STomasz Miąsko // | "l" // i32 2622961f863STomasz Miąsko // | "m" // u32 2632961f863STomasz Miąsko // | "n" // i128 2642961f863STomasz Miąsko // | "o" // u128 2652961f863STomasz Miąsko // | "s" // i16 2662961f863STomasz Miąsko // | "t" // u16 2672961f863STomasz Miąsko // | "u" // () 2682961f863STomasz Miąsko // | "v" // ... 2692961f863STomasz Miąsko // | "x" // i64 2702961f863STomasz Miąsko // | "y" // u64 2712961f863STomasz Miąsko // | "z" // ! 2722961f863STomasz Miąsko // | "p" // placeholder (e.g. for generic params), shown as _ 273cd74dd17STomasz Miąsko static bool parseBasicType(char C, BasicType &Type) { 274cd74dd17STomasz Miąsko switch (C) { 275cd74dd17STomasz Miąsko case 'a': 276cd74dd17STomasz Miąsko Type = BasicType::I8; 277cd74dd17STomasz Miąsko return true; 278cd74dd17STomasz Miąsko case 'b': 279cd74dd17STomasz Miąsko Type = BasicType::Bool; 280cd74dd17STomasz Miąsko return true; 281cd74dd17STomasz Miąsko case 'c': 282cd74dd17STomasz Miąsko Type = BasicType::Char; 283cd74dd17STomasz Miąsko return true; 284cd74dd17STomasz Miąsko case 'd': 285cd74dd17STomasz Miąsko Type = BasicType::F64; 286cd74dd17STomasz Miąsko return true; 287cd74dd17STomasz Miąsko case 'e': 288cd74dd17STomasz Miąsko Type = BasicType::Str; 289cd74dd17STomasz Miąsko return true; 290cd74dd17STomasz Miąsko case 'f': 291cd74dd17STomasz Miąsko Type = BasicType::F32; 292cd74dd17STomasz Miąsko return true; 293cd74dd17STomasz Miąsko case 'h': 294cd74dd17STomasz Miąsko Type = BasicType::U8; 295cd74dd17STomasz Miąsko return true; 296cd74dd17STomasz Miąsko case 'i': 297cd74dd17STomasz Miąsko Type = BasicType::ISize; 298cd74dd17STomasz Miąsko return true; 299cd74dd17STomasz Miąsko case 'j': 300cd74dd17STomasz Miąsko Type = BasicType::USize; 301cd74dd17STomasz Miąsko return true; 302cd74dd17STomasz Miąsko case 'l': 303cd74dd17STomasz Miąsko Type = BasicType::I32; 304cd74dd17STomasz Miąsko return true; 305cd74dd17STomasz Miąsko case 'm': 306cd74dd17STomasz Miąsko Type = BasicType::U32; 307cd74dd17STomasz Miąsko return true; 308cd74dd17STomasz Miąsko case 'n': 309cd74dd17STomasz Miąsko Type = BasicType::I128; 310cd74dd17STomasz Miąsko return true; 311cd74dd17STomasz Miąsko case 'o': 312cd74dd17STomasz Miąsko Type = BasicType::U128; 313cd74dd17STomasz Miąsko return true; 314cd74dd17STomasz Miąsko case 'p': 315cd74dd17STomasz Miąsko Type = BasicType::Placeholder; 316cd74dd17STomasz Miąsko return true; 317cd74dd17STomasz Miąsko case 's': 318cd74dd17STomasz Miąsko Type = BasicType::I16; 319cd74dd17STomasz Miąsko return true; 320cd74dd17STomasz Miąsko case 't': 321cd74dd17STomasz Miąsko Type = BasicType::U16; 322cd74dd17STomasz Miąsko return true; 323cd74dd17STomasz Miąsko case 'u': 324cd74dd17STomasz Miąsko Type = BasicType::Unit; 325cd74dd17STomasz Miąsko return true; 326cd74dd17STomasz Miąsko case 'v': 327cd74dd17STomasz Miąsko Type = BasicType::Variadic; 328cd74dd17STomasz Miąsko return true; 329cd74dd17STomasz Miąsko case 'x': 330cd74dd17STomasz Miąsko Type = BasicType::I64; 331cd74dd17STomasz Miąsko return true; 332cd74dd17STomasz Miąsko case 'y': 333cd74dd17STomasz Miąsko Type = BasicType::U64; 334cd74dd17STomasz Miąsko return true; 335cd74dd17STomasz Miąsko case 'z': 336cd74dd17STomasz Miąsko Type = BasicType::Never; 337cd74dd17STomasz Miąsko return true; 338cd74dd17STomasz Miąsko default: 339cd74dd17STomasz Miąsko return false; 340cd74dd17STomasz Miąsko } 341cd74dd17STomasz Miąsko } 342cd74dd17STomasz Miąsko 343cd74dd17STomasz Miąsko void Demangler::printBasicType(BasicType Type) { 344cd74dd17STomasz Miąsko switch (Type) { 345cd74dd17STomasz Miąsko case BasicType::Bool: 346cd74dd17STomasz Miąsko print("bool"); 347cd74dd17STomasz Miąsko break; 348cd74dd17STomasz Miąsko case BasicType::Char: 349cd74dd17STomasz Miąsko print("char"); 350cd74dd17STomasz Miąsko break; 351cd74dd17STomasz Miąsko case BasicType::I8: 352cd74dd17STomasz Miąsko print("i8"); 353cd74dd17STomasz Miąsko break; 354cd74dd17STomasz Miąsko case BasicType::I16: 355cd74dd17STomasz Miąsko print("i16"); 356cd74dd17STomasz Miąsko break; 357cd74dd17STomasz Miąsko case BasicType::I32: 358cd74dd17STomasz Miąsko print("i32"); 359cd74dd17STomasz Miąsko break; 360cd74dd17STomasz Miąsko case BasicType::I64: 361cd74dd17STomasz Miąsko print("i64"); 362cd74dd17STomasz Miąsko break; 363cd74dd17STomasz Miąsko case BasicType::I128: 364cd74dd17STomasz Miąsko print("i128"); 365cd74dd17STomasz Miąsko break; 366cd74dd17STomasz Miąsko case BasicType::ISize: 367cd74dd17STomasz Miąsko print("isize"); 368cd74dd17STomasz Miąsko break; 369cd74dd17STomasz Miąsko case BasicType::U8: 370cd74dd17STomasz Miąsko print("u8"); 371cd74dd17STomasz Miąsko break; 372cd74dd17STomasz Miąsko case BasicType::U16: 373cd74dd17STomasz Miąsko print("u16"); 374cd74dd17STomasz Miąsko break; 375cd74dd17STomasz Miąsko case BasicType::U32: 376cd74dd17STomasz Miąsko print("u32"); 377cd74dd17STomasz Miąsko break; 378cd74dd17STomasz Miąsko case BasicType::U64: 379cd74dd17STomasz Miąsko print("u64"); 380cd74dd17STomasz Miąsko break; 381cd74dd17STomasz Miąsko case BasicType::U128: 382cd74dd17STomasz Miąsko print("u128"); 383cd74dd17STomasz Miąsko break; 384cd74dd17STomasz Miąsko case BasicType::USize: 385cd74dd17STomasz Miąsko print("usize"); 386cd74dd17STomasz Miąsko break; 387cd74dd17STomasz Miąsko case BasicType::F32: 388cd74dd17STomasz Miąsko print("f32"); 389cd74dd17STomasz Miąsko break; 390cd74dd17STomasz Miąsko case BasicType::F64: 391cd74dd17STomasz Miąsko print("f64"); 392cd74dd17STomasz Miąsko break; 393cd74dd17STomasz Miąsko case BasicType::Str: 394cd74dd17STomasz Miąsko print("str"); 395cd74dd17STomasz Miąsko break; 396cd74dd17STomasz Miąsko case BasicType::Placeholder: 397cd74dd17STomasz Miąsko print("_"); 398cd74dd17STomasz Miąsko break; 399cd74dd17STomasz Miąsko case BasicType::Unit: 400cd74dd17STomasz Miąsko print("()"); 401cd74dd17STomasz Miąsko break; 402cd74dd17STomasz Miąsko case BasicType::Variadic: 403cd74dd17STomasz Miąsko print("..."); 404cd74dd17STomasz Miąsko break; 405cd74dd17STomasz Miąsko case BasicType::Never: 406cd74dd17STomasz Miąsko print("!"); 407cd74dd17STomasz Miąsko break; 408cd74dd17STomasz Miąsko } 4092961f863STomasz Miąsko } 4102961f863STomasz Miąsko 4112961f863STomasz Miąsko // <type> = | <basic-type> 4122961f863STomasz Miąsko // | <path> // named type 4132961f863STomasz Miąsko // | "A" <type> <const> // [T; N] 4142961f863STomasz Miąsko // | "S" <type> // [T] 4152961f863STomasz Miąsko // | "T" {<type>} "E" // (T1, T2, T3, ...) 4162961f863STomasz Miąsko // | "R" [<lifetime>] <type> // &T 4172961f863STomasz Miąsko // | "Q" [<lifetime>] <type> // &mut T 4182961f863STomasz Miąsko // | "P" <type> // *const T 4192961f863STomasz Miąsko // | "O" <type> // *mut T 4202961f863STomasz Miąsko // | "F" <fn-sig> // fn(...) -> ... 4212961f863STomasz Miąsko // | "D" <dyn-bounds> <lifetime> // dyn Trait<Assoc = X> + Send + 'a 4222961f863STomasz Miąsko // | <backref> // backref 4232961f863STomasz Miąsko void Demangler::demangleType() { 424b42400ccSTomasz Miąsko size_t Start = Position; 42506833297STomasz Miąsko 426b42400ccSTomasz Miąsko char C = consume(); 427b42400ccSTomasz Miąsko BasicType Type; 428b42400ccSTomasz Miąsko if (parseBasicType(C, Type)) 429b42400ccSTomasz Miąsko return printBasicType(Type); 430b42400ccSTomasz Miąsko 431b42400ccSTomasz Miąsko switch (C) { 432b42400ccSTomasz Miąsko case 'A': 433b42400ccSTomasz Miąsko print("["); 434b42400ccSTomasz Miąsko demangleType(); 435b42400ccSTomasz Miąsko print("; "); 436b42400ccSTomasz Miąsko demangleConst(); 437b42400ccSTomasz Miąsko print("]"); 438b42400ccSTomasz Miąsko break; 439a84c65c2STomasz Miąsko case 'S': 440a84c65c2STomasz Miąsko print("["); 441a84c65c2STomasz Miąsko demangleType(); 442a84c65c2STomasz Miąsko print("]"); 443a84c65c2STomasz Miąsko break; 444774de7a0STomasz Miąsko case 'T': { 445774de7a0STomasz Miąsko print("("); 446774de7a0STomasz Miąsko size_t I = 0; 447774de7a0STomasz Miąsko for (; !Error && !consumeIf('E'); ++I) { 448774de7a0STomasz Miąsko if (I > 0) 449774de7a0STomasz Miąsko print(", "); 450774de7a0STomasz Miąsko demangleType(); 451774de7a0STomasz Miąsko } 452774de7a0STomasz Miąsko if (I == 1) 453774de7a0STomasz Miąsko print(","); 454774de7a0STomasz Miąsko print(")"); 455774de7a0STomasz Miąsko break; 456774de7a0STomasz Miąsko } 457*e4fa6c95STomasz Miąsko case 'R': 458*e4fa6c95STomasz Miąsko print("&"); 459*e4fa6c95STomasz Miąsko // FIXME demangle [<lifetime>]. 460*e4fa6c95STomasz Miąsko demangleType(); 461*e4fa6c95STomasz Miąsko break; 462*e4fa6c95STomasz Miąsko case 'Q': 463*e4fa6c95STomasz Miąsko print("&mut "); 464*e4fa6c95STomasz Miąsko // FIXME demangle [<lifetime>]. 465*e4fa6c95STomasz Miąsko demangleType(); 466*e4fa6c95STomasz Miąsko break; 4676aac5633STomasz Miąsko case 'P': 4686aac5633STomasz Miąsko print("*const "); 4696aac5633STomasz Miąsko demangleType(); 4706aac5633STomasz Miąsko break; 4716aac5633STomasz Miąsko case 'O': 4726aac5633STomasz Miąsko print("*mut "); 4736aac5633STomasz Miąsko demangleType(); 4746aac5633STomasz Miąsko break; 475b42400ccSTomasz Miąsko default: 476b42400ccSTomasz Miąsko Position = Start; 47757f40886STomasz Miąsko demanglePath(rust_demangle::InType::Yes); 478b42400ccSTomasz Miąsko break; 479b42400ccSTomasz Miąsko } 480cd74dd17STomasz Miąsko } 481cd74dd17STomasz Miąsko 482cd74dd17STomasz Miąsko // <const> = <basic-type> <const-data> 483cd74dd17STomasz Miąsko // | "p" // placeholder 484cd74dd17STomasz Miąsko // | <backref> 485cd74dd17STomasz Miąsko void Demangler::demangleConst() { 486cd74dd17STomasz Miąsko BasicType Type; 487cd74dd17STomasz Miąsko if (parseBasicType(consume(), Type)) { 488cd74dd17STomasz Miąsko switch (Type) { 489cd74dd17STomasz Miąsko case BasicType::I8: 490cd74dd17STomasz Miąsko case BasicType::I16: 491cd74dd17STomasz Miąsko case BasicType::I32: 492cd74dd17STomasz Miąsko case BasicType::I64: 493cd74dd17STomasz Miąsko case BasicType::I128: 494cd74dd17STomasz Miąsko case BasicType::ISize: 495cd74dd17STomasz Miąsko case BasicType::U8: 496cd74dd17STomasz Miąsko case BasicType::U16: 497cd74dd17STomasz Miąsko case BasicType::U32: 498cd74dd17STomasz Miąsko case BasicType::U64: 499cd74dd17STomasz Miąsko case BasicType::U128: 500cd74dd17STomasz Miąsko case BasicType::USize: 501cd74dd17STomasz Miąsko demangleConstInt(); 502cd74dd17STomasz Miąsko break; 503fc0f2bb9STomasz Miąsko case BasicType::Bool: 504fc0f2bb9STomasz Miąsko demangleConstBool(); 505fc0f2bb9STomasz Miąsko break; 5062ba49f6aSTomasz Miąsko case BasicType::Char: 5072ba49f6aSTomasz Miąsko demangleConstChar(); 5082ba49f6aSTomasz Miąsko break; 509cd74dd17STomasz Miąsko case BasicType::Placeholder: 510cd74dd17STomasz Miąsko print('_'); 511cd74dd17STomasz Miąsko break; 512cd74dd17STomasz Miąsko default: 5132ba49f6aSTomasz Miąsko // FIXME demangle backreferences. 5142961f863STomasz Miąsko Error = true; 515cd74dd17STomasz Miąsko break; 516cd74dd17STomasz Miąsko } 517cd74dd17STomasz Miąsko } else { 518cd74dd17STomasz Miąsko Error = true; 519cd74dd17STomasz Miąsko } 520cd74dd17STomasz Miąsko } 521cd74dd17STomasz Miąsko 522cd74dd17STomasz Miąsko // <const-data> = ["n"] <hex-number> 523cd74dd17STomasz Miąsko void Demangler::demangleConstInt() { 524cd74dd17STomasz Miąsko if (consumeIf('n')) 525cd74dd17STomasz Miąsko print('-'); 526cd74dd17STomasz Miąsko 527cd74dd17STomasz Miąsko StringView HexDigits; 528cd74dd17STomasz Miąsko uint64_t Value = parseHexNumber(HexDigits); 529cd74dd17STomasz Miąsko if (HexDigits.size() <= 16) { 530cd74dd17STomasz Miąsko printDecimalNumber(Value); 531cd74dd17STomasz Miąsko } else { 532cd74dd17STomasz Miąsko print("0x"); 533cd74dd17STomasz Miąsko print(HexDigits); 5342961f863STomasz Miąsko } 5352961f863STomasz Miąsko } 5362961f863STomasz Miąsko 537fc0f2bb9STomasz Miąsko // <const-data> = "0_" // false 538fc0f2bb9STomasz Miąsko // | "1_" // true 539fc0f2bb9STomasz Miąsko void Demangler::demangleConstBool() { 540fc0f2bb9STomasz Miąsko StringView HexDigits; 541fc0f2bb9STomasz Miąsko parseHexNumber(HexDigits); 542fc0f2bb9STomasz Miąsko if (HexDigits == "0") 543fc0f2bb9STomasz Miąsko print("false"); 544fc0f2bb9STomasz Miąsko else if (HexDigits == "1") 545fc0f2bb9STomasz Miąsko print("true"); 546fc0f2bb9STomasz Miąsko else 547fc0f2bb9STomasz Miąsko Error = true; 548fc0f2bb9STomasz Miąsko } 549fc0f2bb9STomasz Miąsko 5502ba49f6aSTomasz Miąsko /// Returns true if CodePoint represents a printable ASCII character. 5512ba49f6aSTomasz Miąsko static bool isAsciiPrintable(uint64_t CodePoint) { 5522ba49f6aSTomasz Miąsko return 0x20 <= CodePoint && CodePoint <= 0x7e; 5532ba49f6aSTomasz Miąsko } 5542ba49f6aSTomasz Miąsko 5552ba49f6aSTomasz Miąsko // <const-data> = <hex-number> 5562ba49f6aSTomasz Miąsko void Demangler::demangleConstChar() { 5572ba49f6aSTomasz Miąsko StringView HexDigits; 5582ba49f6aSTomasz Miąsko uint64_t CodePoint = parseHexNumber(HexDigits); 5592ba49f6aSTomasz Miąsko if (Error || HexDigits.size() > 6) { 5602ba49f6aSTomasz Miąsko Error = true; 5612ba49f6aSTomasz Miąsko return; 5622ba49f6aSTomasz Miąsko } 5632ba49f6aSTomasz Miąsko 5642ba49f6aSTomasz Miąsko print("'"); 5652ba49f6aSTomasz Miąsko switch (CodePoint) { 5662ba49f6aSTomasz Miąsko case '\t': 5672ba49f6aSTomasz Miąsko print(R"(\t)"); 5682ba49f6aSTomasz Miąsko break; 5692ba49f6aSTomasz Miąsko case '\r': 5702ba49f6aSTomasz Miąsko print(R"(\r)"); 5712ba49f6aSTomasz Miąsko break; 5722ba49f6aSTomasz Miąsko case '\n': 5732ba49f6aSTomasz Miąsko print(R"(\n)"); 5742ba49f6aSTomasz Miąsko break; 5752ba49f6aSTomasz Miąsko case '\\': 5762ba49f6aSTomasz Miąsko print(R"(\\)"); 5772ba49f6aSTomasz Miąsko break; 5782ba49f6aSTomasz Miąsko case '"': 5792ba49f6aSTomasz Miąsko print(R"(")"); 5802ba49f6aSTomasz Miąsko break; 5812ba49f6aSTomasz Miąsko case '\'': 5822ba49f6aSTomasz Miąsko print(R"(\')"); 5832ba49f6aSTomasz Miąsko break; 5842ba49f6aSTomasz Miąsko default: 5852ba49f6aSTomasz Miąsko if (isAsciiPrintable(CodePoint)) { 5862ba49f6aSTomasz Miąsko char C = CodePoint; 5872ba49f6aSTomasz Miąsko print(C); 5882ba49f6aSTomasz Miąsko } else { 5892ba49f6aSTomasz Miąsko print(R"(\u{)"); 5902ba49f6aSTomasz Miąsko print(HexDigits); 5912ba49f6aSTomasz Miąsko print('}'); 5922ba49f6aSTomasz Miąsko } 5932ba49f6aSTomasz Miąsko break; 5942ba49f6aSTomasz Miąsko } 5952ba49f6aSTomasz Miąsko print('\''); 5962ba49f6aSTomasz Miąsko } 5972ba49f6aSTomasz Miąsko 5987310403eSTomasz Miąsko // <undisambiguated-identifier> = ["u"] <decimal-number> ["_"] <bytes> 5997310403eSTomasz Miąsko Identifier Demangler::parseIdentifier() { 6007310403eSTomasz Miąsko bool Punycode = consumeIf('u'); 6017310403eSTomasz Miąsko uint64_t Bytes = parseDecimalNumber(); 6027310403eSTomasz Miąsko 6037310403eSTomasz Miąsko // Underscore resolves the ambiguity when identifier starts with a decimal 6047310403eSTomasz Miąsko // digit or another underscore. 6057310403eSTomasz Miąsko consumeIf('_'); 6067310403eSTomasz Miąsko 6077310403eSTomasz Miąsko if (Error || Bytes > Input.size() - Position) { 6087310403eSTomasz Miąsko Error = true; 6097310403eSTomasz Miąsko return {}; 6107310403eSTomasz Miąsko } 6117310403eSTomasz Miąsko StringView S = Input.substr(Position, Bytes); 6127310403eSTomasz Miąsko Position += Bytes; 6137310403eSTomasz Miąsko 6147310403eSTomasz Miąsko if (!std::all_of(S.begin(), S.end(), isValid)) { 6157310403eSTomasz Miąsko Error = true; 6167310403eSTomasz Miąsko return {}; 6177310403eSTomasz Miąsko } 6187310403eSTomasz Miąsko 6197310403eSTomasz Miąsko return {S, Punycode}; 6207310403eSTomasz Miąsko } 6217310403eSTomasz Miąsko 6227310403eSTomasz Miąsko // Parses optional base 62 number. The presence of a number is determined using 62378e94915STomasz Miąsko // Tag. Returns 0 when tag is absent and parsed value + 1 otherwise. 62478e94915STomasz Miąsko uint64_t Demangler::parseOptionalBase62Number(char Tag) { 62578e94915STomasz Miąsko if (!consumeIf(Tag)) 62678e94915STomasz Miąsko return 0; 62778e94915STomasz Miąsko 62878e94915STomasz Miąsko uint64_t N = parseBase62Number(); 62978e94915STomasz Miąsko if (Error || !addAssign(N, 1)) 63078e94915STomasz Miąsko return 0; 63178e94915STomasz Miąsko 63278e94915STomasz Miąsko return N; 6337310403eSTomasz Miąsko } 6347310403eSTomasz Miąsko 6357310403eSTomasz Miąsko // Parses base 62 number with <0-9a-zA-Z> as digits. Number is terminated by 6367310403eSTomasz Miąsko // "_". All values are offset by 1, so that "_" encodes 0, "0_" encodes 1, 6377310403eSTomasz Miąsko // "1_" encodes 2, etc. 6387310403eSTomasz Miąsko // 6397310403eSTomasz Miąsko // <base-62-number> = {<0-9a-zA-Z>} "_" 6407310403eSTomasz Miąsko uint64_t Demangler::parseBase62Number() { 6417310403eSTomasz Miąsko if (consumeIf('_')) 6427310403eSTomasz Miąsko return 0; 6437310403eSTomasz Miąsko 6447310403eSTomasz Miąsko uint64_t Value = 0; 6457310403eSTomasz Miąsko 6467310403eSTomasz Miąsko while (true) { 6477310403eSTomasz Miąsko uint64_t Digit; 6487310403eSTomasz Miąsko char C = consume(); 6497310403eSTomasz Miąsko 6507310403eSTomasz Miąsko if (C == '_') { 6517310403eSTomasz Miąsko break; 6527310403eSTomasz Miąsko } else if (isDigit(C)) { 6537310403eSTomasz Miąsko Digit = C - '0'; 6547310403eSTomasz Miąsko } else if (isLower(C)) { 6557310403eSTomasz Miąsko Digit = 10 + (C - 'a'); 6567310403eSTomasz Miąsko } else if (isUpper(C)) { 6577310403eSTomasz Miąsko Digit = 10 + 26 + (C - 'A'); 6587310403eSTomasz Miąsko } else { 6597310403eSTomasz Miąsko Error = true; 6607310403eSTomasz Miąsko return 0; 6617310403eSTomasz Miąsko } 6627310403eSTomasz Miąsko 6637310403eSTomasz Miąsko if (!mulAssign(Value, 62)) 6647310403eSTomasz Miąsko return 0; 6657310403eSTomasz Miąsko 6667310403eSTomasz Miąsko if (!addAssign(Value, Digit)) 6677310403eSTomasz Miąsko return 0; 6687310403eSTomasz Miąsko } 6697310403eSTomasz Miąsko 6707310403eSTomasz Miąsko if (!addAssign(Value, 1)) 6717310403eSTomasz Miąsko return 0; 6727310403eSTomasz Miąsko 6737310403eSTomasz Miąsko return Value; 6747310403eSTomasz Miąsko } 6757310403eSTomasz Miąsko 6767310403eSTomasz Miąsko // Parses a decimal number that had been encoded without any leading zeros. 6777310403eSTomasz Miąsko // 6787310403eSTomasz Miąsko // <decimal-number> = "0" 6797310403eSTomasz Miąsko // | <1-9> {<0-9>} 6807310403eSTomasz Miąsko uint64_t Demangler::parseDecimalNumber() { 6817310403eSTomasz Miąsko char C = look(); 6827310403eSTomasz Miąsko if (!isDigit(C)) { 6837310403eSTomasz Miąsko Error = true; 6847310403eSTomasz Miąsko return 0; 6857310403eSTomasz Miąsko } 6867310403eSTomasz Miąsko 6877310403eSTomasz Miąsko if (C == '0') { 6887310403eSTomasz Miąsko consume(); 6897310403eSTomasz Miąsko return 0; 6907310403eSTomasz Miąsko } 6917310403eSTomasz Miąsko 6927310403eSTomasz Miąsko uint64_t Value = 0; 6937310403eSTomasz Miąsko 6947310403eSTomasz Miąsko while (isDigit(look())) { 6957310403eSTomasz Miąsko if (!mulAssign(Value, 10)) { 6967310403eSTomasz Miąsko Error = true; 6977310403eSTomasz Miąsko return 0; 6987310403eSTomasz Miąsko } 6997310403eSTomasz Miąsko 7007310403eSTomasz Miąsko uint64_t D = consume() - '0'; 7017310403eSTomasz Miąsko if (!addAssign(Value, D)) 7027310403eSTomasz Miąsko return 0; 7037310403eSTomasz Miąsko } 7047310403eSTomasz Miąsko 7057310403eSTomasz Miąsko return Value; 7067310403eSTomasz Miąsko } 707cd74dd17STomasz Miąsko 708cd74dd17STomasz Miąsko // Parses a hexadecimal number with <0-9a-f> as a digits. Returns the parsed 709cd74dd17STomasz Miąsko // value and stores hex digits in HexDigits. The return value is unspecified if 710cd74dd17STomasz Miąsko // HexDigits.size() > 16. 711cd74dd17STomasz Miąsko // 712cd74dd17STomasz Miąsko // <hex-number> = "0_" 713cd74dd17STomasz Miąsko // | <1-9a-f> {<0-9a-f>} "_" 714cd74dd17STomasz Miąsko uint64_t Demangler::parseHexNumber(StringView &HexDigits) { 715cd74dd17STomasz Miąsko size_t Start = Position; 716cd74dd17STomasz Miąsko uint64_t Value = 0; 717cd74dd17STomasz Miąsko 718cd74dd17STomasz Miąsko if (!isHexDigit(look())) 719cd74dd17STomasz Miąsko Error = true; 720cd74dd17STomasz Miąsko 721cd74dd17STomasz Miąsko if (consumeIf('0')) { 722cd74dd17STomasz Miąsko if (!consumeIf('_')) 723cd74dd17STomasz Miąsko Error = true; 724cd74dd17STomasz Miąsko } else { 725cd74dd17STomasz Miąsko while (!Error && !consumeIf('_')) { 726cd74dd17STomasz Miąsko char C = consume(); 727cd74dd17STomasz Miąsko Value *= 16; 728cd74dd17STomasz Miąsko if (isDigit(C)) 729cd74dd17STomasz Miąsko Value += C - '0'; 730cd74dd17STomasz Miąsko else if ('a' <= C && C <= 'f') 731cd74dd17STomasz Miąsko Value += 10 + (C - 'a'); 732cd74dd17STomasz Miąsko else 733cd74dd17STomasz Miąsko Error = true; 734cd74dd17STomasz Miąsko } 735cd74dd17STomasz Miąsko } 736cd74dd17STomasz Miąsko 737cd74dd17STomasz Miąsko if (Error) { 738cd74dd17STomasz Miąsko HexDigits = StringView(); 739cd74dd17STomasz Miąsko return 0; 740cd74dd17STomasz Miąsko } 741cd74dd17STomasz Miąsko 742cd74dd17STomasz Miąsko size_t End = Position - 1; 743cd74dd17STomasz Miąsko assert(Start < End); 744cd74dd17STomasz Miąsko HexDigits = Input.substr(Start, End - Start); 745cd74dd17STomasz Miąsko return Value; 746cd74dd17STomasz Miąsko } 747