180814287SRaphael Isemann //===-- DisassemblerLLVMC.cpp ---------------------------------------------===//
2be960424SJonas Devlieghere //
3be960424SJonas Devlieghere // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4be960424SJonas Devlieghere // See https://llvm.org/LICENSE.txt for license information.
5be960424SJonas Devlieghere // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
6be960424SJonas Devlieghere //
7be960424SJonas Devlieghere //===----------------------------------------------------------------------===//
8be960424SJonas Devlieghere
9be960424SJonas Devlieghere #include "DisassemblerLLVMC.h"
10be960424SJonas Devlieghere
11be960424SJonas Devlieghere #include "llvm-c/Disassembler.h"
12be960424SJonas Devlieghere #include "llvm/ADT/SmallString.h"
130231a90bSDavid Spickett #include "llvm/ADT/StringExtras.h"
14be960424SJonas Devlieghere #include "llvm/MC/MCAsmInfo.h"
15be960424SJonas Devlieghere #include "llvm/MC/MCContext.h"
16be960424SJonas Devlieghere #include "llvm/MC/MCDisassembler/MCDisassembler.h"
17be960424SJonas Devlieghere #include "llvm/MC/MCDisassembler/MCExternalSymbolizer.h"
18be960424SJonas Devlieghere #include "llvm/MC/MCDisassembler/MCRelocationInfo.h"
19be960424SJonas Devlieghere #include "llvm/MC/MCInst.h"
20be960424SJonas Devlieghere #include "llvm/MC/MCInstPrinter.h"
21be960424SJonas Devlieghere #include "llvm/MC/MCInstrInfo.h"
22be960424SJonas Devlieghere #include "llvm/MC/MCRegisterInfo.h"
23be960424SJonas Devlieghere #include "llvm/MC/MCSubtargetInfo.h"
24be960424SJonas Devlieghere #include "llvm/MC/MCTargetOptions.h"
2589b57061SReid Kleckner #include "llvm/MC/TargetRegistry.h"
260231a90bSDavid Spickett #include "llvm/Support/AArch64TargetParser.h"
27be960424SJonas Devlieghere #include "llvm/Support/ErrorHandling.h"
28be960424SJonas Devlieghere #include "llvm/Support/ScopedPrinter.h"
29be960424SJonas Devlieghere #include "llvm/Support/TargetSelect.h"
30be960424SJonas Devlieghere
31be960424SJonas Devlieghere #include "lldb/Core/Address.h"
32be960424SJonas Devlieghere #include "lldb/Core/Module.h"
33be960424SJonas Devlieghere #include "lldb/Symbol/SymbolContext.h"
34be960424SJonas Devlieghere #include "lldb/Target/ExecutionContext.h"
35be960424SJonas Devlieghere #include "lldb/Target/Process.h"
36be960424SJonas Devlieghere #include "lldb/Target/RegisterContext.h"
37be960424SJonas Devlieghere #include "lldb/Target/SectionLoadList.h"
38be960424SJonas Devlieghere #include "lldb/Target/StackFrame.h"
39be960424SJonas Devlieghere #include "lldb/Target/Target.h"
40be960424SJonas Devlieghere #include "lldb/Utility/DataExtractor.h"
41c34698a8SPavel Labath #include "lldb/Utility/LLDBLog.h"
42be960424SJonas Devlieghere #include "lldb/Utility/Log.h"
43be960424SJonas Devlieghere #include "lldb/Utility/RegularExpression.h"
44be960424SJonas Devlieghere #include "lldb/Utility/Stream.h"
45be960424SJonas Devlieghere
46be960424SJonas Devlieghere using namespace lldb;
47be960424SJonas Devlieghere using namespace lldb_private;
48be960424SJonas Devlieghere
49bba9ba8dSJonas Devlieghere LLDB_PLUGIN_DEFINE(DisassemblerLLVMC)
50fbb4d1e4SJonas Devlieghere
51be960424SJonas Devlieghere class DisassemblerLLVMC::MCDisasmInstance {
52be960424SJonas Devlieghere public:
53be960424SJonas Devlieghere static std::unique_ptr<MCDisasmInstance>
54be960424SJonas Devlieghere Create(const char *triple, const char *cpu, const char *features_str,
55be960424SJonas Devlieghere unsigned flavor, DisassemblerLLVMC &owner);
56be960424SJonas Devlieghere
57be960424SJonas Devlieghere ~MCDisasmInstance() = default;
58be960424SJonas Devlieghere
59be960424SJonas Devlieghere uint64_t GetMCInst(const uint8_t *opcode_data, size_t opcode_data_len,
60be960424SJonas Devlieghere lldb::addr_t pc, llvm::MCInst &mc_inst) const;
61be960424SJonas Devlieghere void PrintMCInst(llvm::MCInst &mc_inst, std::string &inst_string,
62be960424SJonas Devlieghere std::string &comments_string);
63be960424SJonas Devlieghere void SetStyle(bool use_hex_immed, HexImmediateStyle hex_style);
64be960424SJonas Devlieghere bool CanBranch(llvm::MCInst &mc_inst) const;
65be960424SJonas Devlieghere bool HasDelaySlot(llvm::MCInst &mc_inst) const;
66be960424SJonas Devlieghere bool IsCall(llvm::MCInst &mc_inst) const;
6766902a32SVedant Kumar bool IsLoad(llvm::MCInst &mc_inst) const;
6866902a32SVedant Kumar bool IsAuthenticated(llvm::MCInst &mc_inst) const;
69be960424SJonas Devlieghere
70be960424SJonas Devlieghere private:
71be960424SJonas Devlieghere MCDisasmInstance(std::unique_ptr<llvm::MCInstrInfo> &&instr_info_up,
72be960424SJonas Devlieghere std::unique_ptr<llvm::MCRegisterInfo> &®_info_up,
73be960424SJonas Devlieghere std::unique_ptr<llvm::MCSubtargetInfo> &&subtarget_info_up,
74be960424SJonas Devlieghere std::unique_ptr<llvm::MCAsmInfo> &&asm_info_up,
75be960424SJonas Devlieghere std::unique_ptr<llvm::MCContext> &&context_up,
76be960424SJonas Devlieghere std::unique_ptr<llvm::MCDisassembler> &&disasm_up,
77be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstPrinter> &&instr_printer_up);
78be960424SJonas Devlieghere
79be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstrInfo> m_instr_info_up;
80be960424SJonas Devlieghere std::unique_ptr<llvm::MCRegisterInfo> m_reg_info_up;
81be960424SJonas Devlieghere std::unique_ptr<llvm::MCSubtargetInfo> m_subtarget_info_up;
82be960424SJonas Devlieghere std::unique_ptr<llvm::MCAsmInfo> m_asm_info_up;
83be960424SJonas Devlieghere std::unique_ptr<llvm::MCContext> m_context_up;
84be960424SJonas Devlieghere std::unique_ptr<llvm::MCDisassembler> m_disasm_up;
85be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstPrinter> m_instr_printer_up;
86be960424SJonas Devlieghere };
87be960424SJonas Devlieghere
88*0538e543SWalter Erquinigo namespace x86 {
89*0538e543SWalter Erquinigo
90*0538e543SWalter Erquinigo /// These are the three values deciding instruction control flow kind.
91*0538e543SWalter Erquinigo /// InstructionLengthDecode function decodes an instruction and get this struct.
92*0538e543SWalter Erquinigo ///
93*0538e543SWalter Erquinigo /// primary_opcode
94*0538e543SWalter Erquinigo /// Primary opcode of the instruction.
95*0538e543SWalter Erquinigo /// For one-byte opcode instruction, it's the first byte after prefix.
96*0538e543SWalter Erquinigo /// For two- and three-byte opcodes, it's the second byte.
97*0538e543SWalter Erquinigo ///
98*0538e543SWalter Erquinigo /// opcode_len
99*0538e543SWalter Erquinigo /// The length of opcode in bytes. Valid opcode lengths are 1, 2, or 3.
100*0538e543SWalter Erquinigo ///
101*0538e543SWalter Erquinigo /// modrm
102*0538e543SWalter Erquinigo /// ModR/M byte of the instruction.
103*0538e543SWalter Erquinigo /// Bits[7:6] indicate MOD. Bits[5:3] specify a register and R/M bits[2:0]
104*0538e543SWalter Erquinigo /// may contain a register or specify an addressing mode, depending on MOD.
105*0538e543SWalter Erquinigo struct InstructionOpcodeAndModrm {
106*0538e543SWalter Erquinigo uint8_t primary_opcode;
107*0538e543SWalter Erquinigo uint8_t opcode_len;
108*0538e543SWalter Erquinigo uint8_t modrm;
109*0538e543SWalter Erquinigo };
110*0538e543SWalter Erquinigo
111*0538e543SWalter Erquinigo /// Determine the InstructionControlFlowKind based on opcode and modrm bytes.
112*0538e543SWalter Erquinigo /// Refer to http://ref.x86asm.net/coder.html for the full list of opcode and
113*0538e543SWalter Erquinigo /// instruction set.
114*0538e543SWalter Erquinigo ///
115*0538e543SWalter Erquinigo /// \param[in] opcode_and_modrm
116*0538e543SWalter Erquinigo /// Contains primary_opcode byte, its length, and ModR/M byte.
117*0538e543SWalter Erquinigo /// Refer to the struct InstructionOpcodeAndModrm for details.
118*0538e543SWalter Erquinigo ///
119*0538e543SWalter Erquinigo /// \return
120*0538e543SWalter Erquinigo /// The control flow kind of the instruction or
121*0538e543SWalter Erquinigo /// eInstructionControlFlowKindOther if the instruction doesn't affect
122*0538e543SWalter Erquinigo /// the control flow of the program.
123*0538e543SWalter Erquinigo lldb::InstructionControlFlowKind
MapOpcodeIntoControlFlowKind(InstructionOpcodeAndModrm opcode_and_modrm)124*0538e543SWalter Erquinigo MapOpcodeIntoControlFlowKind(InstructionOpcodeAndModrm opcode_and_modrm) {
125*0538e543SWalter Erquinigo uint8_t opcode = opcode_and_modrm.primary_opcode;
126*0538e543SWalter Erquinigo uint8_t opcode_len = opcode_and_modrm.opcode_len;
127*0538e543SWalter Erquinigo uint8_t modrm = opcode_and_modrm.modrm;
128*0538e543SWalter Erquinigo
129*0538e543SWalter Erquinigo if (opcode_len > 2)
130*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindOther;
131*0538e543SWalter Erquinigo
132*0538e543SWalter Erquinigo if (opcode >= 0x70 && opcode <= 0x7F) {
133*0538e543SWalter Erquinigo if (opcode_len == 1)
134*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindCondJump;
135*0538e543SWalter Erquinigo else
136*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindOther;
137*0538e543SWalter Erquinigo }
138*0538e543SWalter Erquinigo
139*0538e543SWalter Erquinigo if (opcode >= 0x80 && opcode <= 0x8F) {
140*0538e543SWalter Erquinigo if (opcode_len == 2)
141*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindCondJump;
142*0538e543SWalter Erquinigo else
143*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindOther;
144*0538e543SWalter Erquinigo }
145*0538e543SWalter Erquinigo
146*0538e543SWalter Erquinigo switch (opcode) {
147*0538e543SWalter Erquinigo case 0x9A:
148*0538e543SWalter Erquinigo if (opcode_len == 1)
149*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarCall;
150*0538e543SWalter Erquinigo break;
151*0538e543SWalter Erquinigo case 0xFF:
152*0538e543SWalter Erquinigo if (opcode_len == 1) {
153*0538e543SWalter Erquinigo uint8_t modrm_reg = (modrm >> 3) & 7;
154*0538e543SWalter Erquinigo if (modrm_reg == 2)
155*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindCall;
156*0538e543SWalter Erquinigo else if (modrm_reg == 3)
157*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarCall;
158*0538e543SWalter Erquinigo else if (modrm_reg == 4)
159*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindJump;
160*0538e543SWalter Erquinigo else if (modrm_reg == 5)
161*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarJump;
162*0538e543SWalter Erquinigo }
163*0538e543SWalter Erquinigo break;
164*0538e543SWalter Erquinigo case 0xE8:
165*0538e543SWalter Erquinigo if (opcode_len == 1)
166*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindCall;
167*0538e543SWalter Erquinigo break;
168*0538e543SWalter Erquinigo case 0xCD:
169*0538e543SWalter Erquinigo case 0xCC:
170*0538e543SWalter Erquinigo case 0xCE:
171*0538e543SWalter Erquinigo case 0xF1:
172*0538e543SWalter Erquinigo if (opcode_len == 1)
173*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarCall;
174*0538e543SWalter Erquinigo break;
175*0538e543SWalter Erquinigo case 0xCF:
176*0538e543SWalter Erquinigo if (opcode_len == 1)
177*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarReturn;
178*0538e543SWalter Erquinigo break;
179*0538e543SWalter Erquinigo case 0xE9:
180*0538e543SWalter Erquinigo case 0xEB:
181*0538e543SWalter Erquinigo if (opcode_len == 1)
182*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindJump;
183*0538e543SWalter Erquinigo break;
184*0538e543SWalter Erquinigo case 0xEA:
185*0538e543SWalter Erquinigo if (opcode_len == 1)
186*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarJump;
187*0538e543SWalter Erquinigo break;
188*0538e543SWalter Erquinigo case 0xE3:
189*0538e543SWalter Erquinigo case 0xE0:
190*0538e543SWalter Erquinigo case 0xE1:
191*0538e543SWalter Erquinigo case 0xE2:
192*0538e543SWalter Erquinigo if (opcode_len == 1)
193*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindCondJump;
194*0538e543SWalter Erquinigo break;
195*0538e543SWalter Erquinigo case 0xC3:
196*0538e543SWalter Erquinigo case 0xC2:
197*0538e543SWalter Erquinigo if (opcode_len == 1)
198*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindReturn;
199*0538e543SWalter Erquinigo break;
200*0538e543SWalter Erquinigo case 0xCB:
201*0538e543SWalter Erquinigo case 0xCA:
202*0538e543SWalter Erquinigo if (opcode_len == 1)
203*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarReturn;
204*0538e543SWalter Erquinigo break;
205*0538e543SWalter Erquinigo case 0x05:
206*0538e543SWalter Erquinigo case 0x34:
207*0538e543SWalter Erquinigo if (opcode_len == 2)
208*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarCall;
209*0538e543SWalter Erquinigo break;
210*0538e543SWalter Erquinigo case 0x35:
211*0538e543SWalter Erquinigo case 0x07:
212*0538e543SWalter Erquinigo if (opcode_len == 2)
213*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarReturn;
214*0538e543SWalter Erquinigo break;
215*0538e543SWalter Erquinigo case 0x01:
216*0538e543SWalter Erquinigo if (opcode_len == 2) {
217*0538e543SWalter Erquinigo switch (modrm) {
218*0538e543SWalter Erquinigo case 0xc1:
219*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarCall;
220*0538e543SWalter Erquinigo case 0xc2:
221*0538e543SWalter Erquinigo case 0xc3:
222*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindFarReturn;
223*0538e543SWalter Erquinigo default:
224*0538e543SWalter Erquinigo break;
225*0538e543SWalter Erquinigo }
226*0538e543SWalter Erquinigo }
227*0538e543SWalter Erquinigo break;
228*0538e543SWalter Erquinigo default:
229*0538e543SWalter Erquinigo break;
230*0538e543SWalter Erquinigo }
231*0538e543SWalter Erquinigo
232*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindOther;
233*0538e543SWalter Erquinigo }
234*0538e543SWalter Erquinigo
235*0538e543SWalter Erquinigo /// Decode an instruction into opcode, modrm and opcode_len.
236*0538e543SWalter Erquinigo /// Refer to http://ref.x86asm.net/coder.html for the instruction bytes layout.
237*0538e543SWalter Erquinigo /// Opcodes in x86 are generally the first byte of instruction, though two-byte
238*0538e543SWalter Erquinigo /// instructions and prefixes exist. ModR/M is the byte following the opcode
239*0538e543SWalter Erquinigo /// and adds additional information for how the instruction is executed.
240*0538e543SWalter Erquinigo ///
241*0538e543SWalter Erquinigo /// \param[in] inst_bytes
242*0538e543SWalter Erquinigo /// Raw bytes of the instruction
243*0538e543SWalter Erquinigo ///
244*0538e543SWalter Erquinigo ///
245*0538e543SWalter Erquinigo /// \param[in] bytes_len
246*0538e543SWalter Erquinigo /// The length of the inst_bytes array.
247*0538e543SWalter Erquinigo ///
248*0538e543SWalter Erquinigo /// \param[in] is_exec_mode_64b
249*0538e543SWalter Erquinigo /// If true, the execution mode is 64 bit.
250*0538e543SWalter Erquinigo ///
251*0538e543SWalter Erquinigo /// \return
252*0538e543SWalter Erquinigo /// Returns decoded instruction as struct InstructionOpcodeAndModrm, holding
253*0538e543SWalter Erquinigo /// primary_opcode, opcode_len and modrm byte. Refer to the struct definition
254*0538e543SWalter Erquinigo /// for more details.
255*0538e543SWalter Erquinigo /// Otherwise if the given instruction is invalid, returns None.
256*0538e543SWalter Erquinigo llvm::Optional<InstructionOpcodeAndModrm>
InstructionLengthDecode(const uint8_t * inst_bytes,int bytes_len,bool is_exec_mode_64b)257*0538e543SWalter Erquinigo InstructionLengthDecode(const uint8_t *inst_bytes, int bytes_len,
258*0538e543SWalter Erquinigo bool is_exec_mode_64b) {
259*0538e543SWalter Erquinigo int op_idx = 0;
260*0538e543SWalter Erquinigo bool prefix_done = false;
261*0538e543SWalter Erquinigo InstructionOpcodeAndModrm ret = {0, 0, 0};
262*0538e543SWalter Erquinigo
263*0538e543SWalter Erquinigo // In most cases, the primary_opcode is the first byte of the instruction
264*0538e543SWalter Erquinigo // but some instructions have a prefix to be skipped for these calculations.
265*0538e543SWalter Erquinigo // The following mapping is inspired from libipt's instruction decoding logic
266*0538e543SWalter Erquinigo // in `src/pt_ild.c`
267*0538e543SWalter Erquinigo while (!prefix_done) {
268*0538e543SWalter Erquinigo if (op_idx >= bytes_len)
269*0538e543SWalter Erquinigo return llvm::None;
270*0538e543SWalter Erquinigo
271*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[op_idx];
272*0538e543SWalter Erquinigo switch (ret.primary_opcode) {
273*0538e543SWalter Erquinigo // prefix_ignore
274*0538e543SWalter Erquinigo case 0x26:
275*0538e543SWalter Erquinigo case 0x2e:
276*0538e543SWalter Erquinigo case 0x36:
277*0538e543SWalter Erquinigo case 0x3e:
278*0538e543SWalter Erquinigo case 0x64:
279*0538e543SWalter Erquinigo case 0x65:
280*0538e543SWalter Erquinigo // prefix_osz, prefix_asz
281*0538e543SWalter Erquinigo case 0x66:
282*0538e543SWalter Erquinigo case 0x67:
283*0538e543SWalter Erquinigo // prefix_lock, prefix_f2, prefix_f3
284*0538e543SWalter Erquinigo case 0xf0:
285*0538e543SWalter Erquinigo case 0xf2:
286*0538e543SWalter Erquinigo case 0xf3:
287*0538e543SWalter Erquinigo op_idx++;
288*0538e543SWalter Erquinigo break;
289*0538e543SWalter Erquinigo
290*0538e543SWalter Erquinigo // prefix_rex
291*0538e543SWalter Erquinigo case 0x40:
292*0538e543SWalter Erquinigo case 0x41:
293*0538e543SWalter Erquinigo case 0x42:
294*0538e543SWalter Erquinigo case 0x43:
295*0538e543SWalter Erquinigo case 0x44:
296*0538e543SWalter Erquinigo case 0x45:
297*0538e543SWalter Erquinigo case 0x46:
298*0538e543SWalter Erquinigo case 0x47:
299*0538e543SWalter Erquinigo case 0x48:
300*0538e543SWalter Erquinigo case 0x49:
301*0538e543SWalter Erquinigo case 0x4a:
302*0538e543SWalter Erquinigo case 0x4b:
303*0538e543SWalter Erquinigo case 0x4c:
304*0538e543SWalter Erquinigo case 0x4d:
305*0538e543SWalter Erquinigo case 0x4e:
306*0538e543SWalter Erquinigo case 0x4f:
307*0538e543SWalter Erquinigo if (is_exec_mode_64b)
308*0538e543SWalter Erquinigo op_idx++;
309*0538e543SWalter Erquinigo else
310*0538e543SWalter Erquinigo prefix_done = true;
311*0538e543SWalter Erquinigo break;
312*0538e543SWalter Erquinigo
313*0538e543SWalter Erquinigo // prefix_vex_c4, c5
314*0538e543SWalter Erquinigo case 0xc5:
315*0538e543SWalter Erquinigo if (!is_exec_mode_64b && (inst_bytes[op_idx + 1] & 0xc0) != 0xc0) {
316*0538e543SWalter Erquinigo prefix_done = true;
317*0538e543SWalter Erquinigo break;
318*0538e543SWalter Erquinigo }
319*0538e543SWalter Erquinigo
320*0538e543SWalter Erquinigo ret.opcode_len = 2;
321*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[op_idx + 2];
322*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 3];
323*0538e543SWalter Erquinigo return ret;
324*0538e543SWalter Erquinigo
325*0538e543SWalter Erquinigo case 0xc4:
326*0538e543SWalter Erquinigo if (!is_exec_mode_64b && (inst_bytes[op_idx + 1] & 0xc0) != 0xc0) {
327*0538e543SWalter Erquinigo prefix_done = true;
328*0538e543SWalter Erquinigo break;
329*0538e543SWalter Erquinigo }
330*0538e543SWalter Erquinigo ret.opcode_len = inst_bytes[op_idx + 1] & 0x1f;
331*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[op_idx + 3];
332*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 4];
333*0538e543SWalter Erquinigo return ret;
334*0538e543SWalter Erquinigo
335*0538e543SWalter Erquinigo // prefix_evex
336*0538e543SWalter Erquinigo case 0x62:
337*0538e543SWalter Erquinigo if (!is_exec_mode_64b && (inst_bytes[op_idx + 1] & 0xc0) != 0xc0) {
338*0538e543SWalter Erquinigo prefix_done = true;
339*0538e543SWalter Erquinigo break;
340*0538e543SWalter Erquinigo }
341*0538e543SWalter Erquinigo ret.opcode_len = inst_bytes[op_idx + 1] & 0x03;
342*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[op_idx + 4];
343*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 5];
344*0538e543SWalter Erquinigo return ret;
345*0538e543SWalter Erquinigo
346*0538e543SWalter Erquinigo default:
347*0538e543SWalter Erquinigo prefix_done = true;
348*0538e543SWalter Erquinigo break;
349*0538e543SWalter Erquinigo }
350*0538e543SWalter Erquinigo } // prefix done
351*0538e543SWalter Erquinigo
352*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[op_idx];
353*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
354*0538e543SWalter Erquinigo ret.opcode_len = 1;
355*0538e543SWalter Erquinigo
356*0538e543SWalter Erquinigo // If the first opcode is 0F, it's two- or three- byte opcodes.
357*0538e543SWalter Erquinigo if (ret.primary_opcode == 0x0F) {
358*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[++op_idx]; // get the next byte
359*0538e543SWalter Erquinigo
360*0538e543SWalter Erquinigo if (ret.primary_opcode == 0x38) {
361*0538e543SWalter Erquinigo ret.opcode_len = 3;
362*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[++op_idx]; // get the next byte
363*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
364*0538e543SWalter Erquinigo } else if (ret.primary_opcode == 0x3A) {
365*0538e543SWalter Erquinigo ret.opcode_len = 3;
366*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[++op_idx];
367*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
368*0538e543SWalter Erquinigo } else if ((ret.primary_opcode & 0xf8) == 0x38) {
369*0538e543SWalter Erquinigo ret.opcode_len = 0;
370*0538e543SWalter Erquinigo ret.primary_opcode = inst_bytes[++op_idx];
371*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
372*0538e543SWalter Erquinigo } else if (ret.primary_opcode == 0x0F) {
373*0538e543SWalter Erquinigo ret.opcode_len = 3;
374*0538e543SWalter Erquinigo // opcode is 0x0F, no needs to update
375*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
376*0538e543SWalter Erquinigo } else {
377*0538e543SWalter Erquinigo ret.opcode_len = 2;
378*0538e543SWalter Erquinigo ret.modrm = inst_bytes[op_idx + 1];
379*0538e543SWalter Erquinigo }
380*0538e543SWalter Erquinigo }
381*0538e543SWalter Erquinigo
382*0538e543SWalter Erquinigo return ret;
383*0538e543SWalter Erquinigo }
384*0538e543SWalter Erquinigo
GetControlFlowKind(bool is_exec_mode_64b,Opcode m_opcode)385*0538e543SWalter Erquinigo lldb::InstructionControlFlowKind GetControlFlowKind(bool is_exec_mode_64b,
386*0538e543SWalter Erquinigo Opcode m_opcode) {
387*0538e543SWalter Erquinigo llvm::Optional<InstructionOpcodeAndModrm> ret = llvm::None;
388*0538e543SWalter Erquinigo
389*0538e543SWalter Erquinigo if (m_opcode.GetOpcodeBytes() == nullptr || m_opcode.GetByteSize() <= 0) {
390*0538e543SWalter Erquinigo // x86_64 and i386 instructions are categorized as Opcode::Type::eTypeBytes
391*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindUnknown;
392*0538e543SWalter Erquinigo }
393*0538e543SWalter Erquinigo
394*0538e543SWalter Erquinigo // Opcode bytes will be decoded into primary_opcode, modrm and opcode length.
395*0538e543SWalter Erquinigo // These are the three values deciding instruction control flow kind.
396*0538e543SWalter Erquinigo ret = InstructionLengthDecode((const uint8_t *)m_opcode.GetOpcodeBytes(),
397*0538e543SWalter Erquinigo m_opcode.GetByteSize(), is_exec_mode_64b);
398*0538e543SWalter Erquinigo if (!ret)
399*0538e543SWalter Erquinigo return lldb::eInstructionControlFlowKindUnknown;
400*0538e543SWalter Erquinigo else
401*0538e543SWalter Erquinigo return MapOpcodeIntoControlFlowKind(ret.value());
402*0538e543SWalter Erquinigo }
403*0538e543SWalter Erquinigo
404*0538e543SWalter Erquinigo } // namespace x86
405*0538e543SWalter Erquinigo
406be960424SJonas Devlieghere class InstructionLLVMC : public lldb_private::Instruction {
407be960424SJonas Devlieghere public:
InstructionLLVMC(DisassemblerLLVMC & disasm,const lldb_private::Address & address,AddressClass addr_class)408be960424SJonas Devlieghere InstructionLLVMC(DisassemblerLLVMC &disasm,
409be960424SJonas Devlieghere const lldb_private::Address &address,
410be960424SJonas Devlieghere AddressClass addr_class)
411be960424SJonas Devlieghere : Instruction(address, addr_class),
412be960424SJonas Devlieghere m_disasm_wp(std::static_pointer_cast<DisassemblerLLVMC>(
41328c878aeSShafik Yaghmour disasm.shared_from_this())) {}
414be960424SJonas Devlieghere
415be960424SJonas Devlieghere ~InstructionLLVMC() override = default;
416be960424SJonas Devlieghere
DoesBranch()417be960424SJonas Devlieghere bool DoesBranch() override {
418009e3e53SVedant Kumar VisitInstruction();
419009e3e53SVedant Kumar return m_does_branch;
420be960424SJonas Devlieghere }
421be960424SJonas Devlieghere
HasDelaySlot()422be960424SJonas Devlieghere bool HasDelaySlot() override {
423009e3e53SVedant Kumar VisitInstruction();
424009e3e53SVedant Kumar return m_has_delay_slot;
425be960424SJonas Devlieghere }
426be960424SJonas Devlieghere
IsLoad()42766902a32SVedant Kumar bool IsLoad() override {
42866902a32SVedant Kumar VisitInstruction();
42966902a32SVedant Kumar return m_is_load;
43066902a32SVedant Kumar }
43166902a32SVedant Kumar
IsAuthenticated()43266902a32SVedant Kumar bool IsAuthenticated() override {
43366902a32SVedant Kumar VisitInstruction();
43466902a32SVedant Kumar return m_is_authenticated;
43566902a32SVedant Kumar }
43666902a32SVedant Kumar
GetDisasmToUse(bool & is_alternate_isa)437be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance *GetDisasmToUse(bool &is_alternate_isa) {
438be960424SJonas Devlieghere DisassemblerScope disasm(*this);
439be960424SJonas Devlieghere return GetDisasmToUse(is_alternate_isa, disasm);
440be960424SJonas Devlieghere }
441be960424SJonas Devlieghere
Decode(const lldb_private::Disassembler & disassembler,const lldb_private::DataExtractor & data,lldb::offset_t data_offset)442be960424SJonas Devlieghere size_t Decode(const lldb_private::Disassembler &disassembler,
443be960424SJonas Devlieghere const lldb_private::DataExtractor &data,
444be960424SJonas Devlieghere lldb::offset_t data_offset) override {
445be960424SJonas Devlieghere // All we have to do is read the opcode which can be easy for some
446be960424SJonas Devlieghere // architectures
447be960424SJonas Devlieghere bool got_op = false;
448be960424SJonas Devlieghere DisassemblerScope disasm(*this);
449be960424SJonas Devlieghere if (disasm) {
450be960424SJonas Devlieghere const ArchSpec &arch = disasm->GetArchitecture();
451be960424SJonas Devlieghere const lldb::ByteOrder byte_order = data.GetByteOrder();
452be960424SJonas Devlieghere
453be960424SJonas Devlieghere const uint32_t min_op_byte_size = arch.GetMinimumOpcodeByteSize();
454be960424SJonas Devlieghere const uint32_t max_op_byte_size = arch.GetMaximumOpcodeByteSize();
455be960424SJonas Devlieghere if (min_op_byte_size == max_op_byte_size) {
456be960424SJonas Devlieghere // Fixed size instructions, just read that amount of data.
457be960424SJonas Devlieghere if (!data.ValidOffsetForDataOfSize(data_offset, min_op_byte_size))
458be960424SJonas Devlieghere return false;
459be960424SJonas Devlieghere
460be960424SJonas Devlieghere switch (min_op_byte_size) {
461be960424SJonas Devlieghere case 1:
462be960424SJonas Devlieghere m_opcode.SetOpcode8(data.GetU8(&data_offset), byte_order);
463be960424SJonas Devlieghere got_op = true;
464be960424SJonas Devlieghere break;
465be960424SJonas Devlieghere
466be960424SJonas Devlieghere case 2:
467be960424SJonas Devlieghere m_opcode.SetOpcode16(data.GetU16(&data_offset), byte_order);
468be960424SJonas Devlieghere got_op = true;
469be960424SJonas Devlieghere break;
470be960424SJonas Devlieghere
471be960424SJonas Devlieghere case 4:
472be960424SJonas Devlieghere m_opcode.SetOpcode32(data.GetU32(&data_offset), byte_order);
473be960424SJonas Devlieghere got_op = true;
474be960424SJonas Devlieghere break;
475be960424SJonas Devlieghere
476be960424SJonas Devlieghere case 8:
477be960424SJonas Devlieghere m_opcode.SetOpcode64(data.GetU64(&data_offset), byte_order);
478be960424SJonas Devlieghere got_op = true;
479be960424SJonas Devlieghere break;
480be960424SJonas Devlieghere
481be960424SJonas Devlieghere default:
482be960424SJonas Devlieghere m_opcode.SetOpcodeBytes(data.PeekData(data_offset, min_op_byte_size),
483be960424SJonas Devlieghere min_op_byte_size);
484be960424SJonas Devlieghere got_op = true;
485be960424SJonas Devlieghere break;
486be960424SJonas Devlieghere }
487be960424SJonas Devlieghere }
488be960424SJonas Devlieghere if (!got_op) {
489be960424SJonas Devlieghere bool is_alternate_isa = false;
490be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance *mc_disasm_ptr =
491be960424SJonas Devlieghere GetDisasmToUse(is_alternate_isa, disasm);
492be960424SJonas Devlieghere
493be960424SJonas Devlieghere const llvm::Triple::ArchType machine = arch.GetMachine();
494be960424SJonas Devlieghere if (machine == llvm::Triple::arm || machine == llvm::Triple::thumb) {
495be960424SJonas Devlieghere if (machine == llvm::Triple::thumb || is_alternate_isa) {
496be960424SJonas Devlieghere uint32_t thumb_opcode = data.GetU16(&data_offset);
497be960424SJonas Devlieghere if ((thumb_opcode & 0xe000) != 0xe000 ||
498be960424SJonas Devlieghere ((thumb_opcode & 0x1800u) == 0)) {
499be960424SJonas Devlieghere m_opcode.SetOpcode16(thumb_opcode, byte_order);
500be960424SJonas Devlieghere m_is_valid = true;
501be960424SJonas Devlieghere } else {
502be960424SJonas Devlieghere thumb_opcode <<= 16;
503be960424SJonas Devlieghere thumb_opcode |= data.GetU16(&data_offset);
504be960424SJonas Devlieghere m_opcode.SetOpcode16_2(thumb_opcode, byte_order);
505be960424SJonas Devlieghere m_is_valid = true;
506be960424SJonas Devlieghere }
507be960424SJonas Devlieghere } else {
508be960424SJonas Devlieghere m_opcode.SetOpcode32(data.GetU32(&data_offset), byte_order);
509be960424SJonas Devlieghere m_is_valid = true;
510be960424SJonas Devlieghere }
511be960424SJonas Devlieghere } else {
512be960424SJonas Devlieghere // The opcode isn't evenly sized, so we need to actually use the llvm
513be960424SJonas Devlieghere // disassembler to parse it and get the size.
514be960424SJonas Devlieghere uint8_t *opcode_data =
515be960424SJonas Devlieghere const_cast<uint8_t *>(data.PeekData(data_offset, 1));
516be960424SJonas Devlieghere const size_t opcode_data_len = data.BytesLeft(data_offset);
517be960424SJonas Devlieghere const addr_t pc = m_address.GetFileAddress();
518be960424SJonas Devlieghere llvm::MCInst inst;
519be960424SJonas Devlieghere
520be960424SJonas Devlieghere const size_t inst_size =
521be960424SJonas Devlieghere mc_disasm_ptr->GetMCInst(opcode_data, opcode_data_len, pc, inst);
522be960424SJonas Devlieghere if (inst_size == 0)
523be960424SJonas Devlieghere m_opcode.Clear();
524be960424SJonas Devlieghere else {
525be960424SJonas Devlieghere m_opcode.SetOpcodeBytes(opcode_data, inst_size);
526be960424SJonas Devlieghere m_is_valid = true;
527be960424SJonas Devlieghere }
528be960424SJonas Devlieghere }
529be960424SJonas Devlieghere }
530be960424SJonas Devlieghere return m_opcode.GetByteSize();
531be960424SJonas Devlieghere }
532be960424SJonas Devlieghere return 0;
533be960424SJonas Devlieghere }
534be960424SJonas Devlieghere
AppendComment(std::string & description)535be960424SJonas Devlieghere void AppendComment(std::string &description) {
536be960424SJonas Devlieghere if (m_comment.empty())
537be960424SJonas Devlieghere m_comment.swap(description);
538be960424SJonas Devlieghere else {
539be960424SJonas Devlieghere m_comment.append(", ");
540be960424SJonas Devlieghere m_comment.append(description);
541be960424SJonas Devlieghere }
542be960424SJonas Devlieghere }
543be960424SJonas Devlieghere
544*0538e543SWalter Erquinigo lldb::InstructionControlFlowKind
GetControlFlowKind(const lldb_private::ExecutionContext * exe_ctx)545*0538e543SWalter Erquinigo GetControlFlowKind(const lldb_private::ExecutionContext *exe_ctx) override {
546*0538e543SWalter Erquinigo DisassemblerScope disasm(*this, exe_ctx);
547*0538e543SWalter Erquinigo if (disasm){
548*0538e543SWalter Erquinigo if (disasm->GetArchitecture().GetMachine() == llvm::Triple::x86)
549*0538e543SWalter Erquinigo return x86::GetControlFlowKind(/*is_64b=*/false, m_opcode);
550*0538e543SWalter Erquinigo else if (disasm->GetArchitecture().GetMachine() == llvm::Triple::x86_64)
551*0538e543SWalter Erquinigo return x86::GetControlFlowKind(/*is_64b=*/true, m_opcode);
552*0538e543SWalter Erquinigo }
553*0538e543SWalter Erquinigo
554*0538e543SWalter Erquinigo return eInstructionControlFlowKindUnknown;
555*0538e543SWalter Erquinigo }
556*0538e543SWalter Erquinigo
CalculateMnemonicOperandsAndComment(const lldb_private::ExecutionContext * exe_ctx)557be960424SJonas Devlieghere void CalculateMnemonicOperandsAndComment(
558be960424SJonas Devlieghere const lldb_private::ExecutionContext *exe_ctx) override {
559be960424SJonas Devlieghere DataExtractor data;
560be960424SJonas Devlieghere const AddressClass address_class = GetAddressClass();
561be960424SJonas Devlieghere
562be960424SJonas Devlieghere if (m_opcode.GetData(data)) {
563be960424SJonas Devlieghere std::string out_string;
564be960424SJonas Devlieghere std::string comment_string;
565be960424SJonas Devlieghere
566be960424SJonas Devlieghere DisassemblerScope disasm(*this, exe_ctx);
567be960424SJonas Devlieghere if (disasm) {
568be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance *mc_disasm_ptr;
569be960424SJonas Devlieghere
570be960424SJonas Devlieghere if (address_class == AddressClass::eCodeAlternateISA)
571be960424SJonas Devlieghere mc_disasm_ptr = disasm->m_alternate_disasm_up.get();
572be960424SJonas Devlieghere else
573be960424SJonas Devlieghere mc_disasm_ptr = disasm->m_disasm_up.get();
574be960424SJonas Devlieghere
575be960424SJonas Devlieghere lldb::addr_t pc = m_address.GetFileAddress();
576be960424SJonas Devlieghere m_using_file_addr = true;
577be960424SJonas Devlieghere
578be960424SJonas Devlieghere const bool data_from_file = disasm->m_data_from_file;
579be960424SJonas Devlieghere bool use_hex_immediates = true;
580be960424SJonas Devlieghere Disassembler::HexImmediateStyle hex_style = Disassembler::eHexStyleC;
581be960424SJonas Devlieghere
582be960424SJonas Devlieghere if (exe_ctx) {
583be960424SJonas Devlieghere Target *target = exe_ctx->GetTargetPtr();
584be960424SJonas Devlieghere if (target) {
585be960424SJonas Devlieghere use_hex_immediates = target->GetUseHexImmediates();
586be960424SJonas Devlieghere hex_style = target->GetHexImmediateStyle();
587be960424SJonas Devlieghere
588be960424SJonas Devlieghere if (!data_from_file) {
589be960424SJonas Devlieghere const lldb::addr_t load_addr = m_address.GetLoadAddress(target);
590be960424SJonas Devlieghere if (load_addr != LLDB_INVALID_ADDRESS) {
591be960424SJonas Devlieghere pc = load_addr;
592be960424SJonas Devlieghere m_using_file_addr = false;
593be960424SJonas Devlieghere }
594be960424SJonas Devlieghere }
595be960424SJonas Devlieghere }
596be960424SJonas Devlieghere }
597be960424SJonas Devlieghere
598be960424SJonas Devlieghere const uint8_t *opcode_data = data.GetDataStart();
599be960424SJonas Devlieghere const size_t opcode_data_len = data.GetByteSize();
600be960424SJonas Devlieghere llvm::MCInst inst;
601be960424SJonas Devlieghere size_t inst_size =
602be960424SJonas Devlieghere mc_disasm_ptr->GetMCInst(opcode_data, opcode_data_len, pc, inst);
603be960424SJonas Devlieghere
604be960424SJonas Devlieghere if (inst_size > 0) {
605be960424SJonas Devlieghere mc_disasm_ptr->SetStyle(use_hex_immediates, hex_style);
606be960424SJonas Devlieghere mc_disasm_ptr->PrintMCInst(inst, out_string, comment_string);
607be960424SJonas Devlieghere
608be960424SJonas Devlieghere if (!comment_string.empty()) {
609be960424SJonas Devlieghere AppendComment(comment_string);
610be960424SJonas Devlieghere }
611be960424SJonas Devlieghere }
612be960424SJonas Devlieghere
613be960424SJonas Devlieghere if (inst_size == 0) {
614be960424SJonas Devlieghere m_comment.assign("unknown opcode");
615be960424SJonas Devlieghere inst_size = m_opcode.GetByteSize();
616be960424SJonas Devlieghere StreamString mnemonic_strm;
617be960424SJonas Devlieghere lldb::offset_t offset = 0;
618be960424SJonas Devlieghere lldb::ByteOrder byte_order = data.GetByteOrder();
619be960424SJonas Devlieghere switch (inst_size) {
620be960424SJonas Devlieghere case 1: {
621be960424SJonas Devlieghere const uint8_t uval8 = data.GetU8(&offset);
622be960424SJonas Devlieghere m_opcode.SetOpcode8(uval8, byte_order);
623be960424SJonas Devlieghere m_opcode_name.assign(".byte");
624be960424SJonas Devlieghere mnemonic_strm.Printf("0x%2.2x", uval8);
625be960424SJonas Devlieghere } break;
626be960424SJonas Devlieghere case 2: {
627be960424SJonas Devlieghere const uint16_t uval16 = data.GetU16(&offset);
628be960424SJonas Devlieghere m_opcode.SetOpcode16(uval16, byte_order);
629be960424SJonas Devlieghere m_opcode_name.assign(".short");
630be960424SJonas Devlieghere mnemonic_strm.Printf("0x%4.4x", uval16);
631be960424SJonas Devlieghere } break;
632be960424SJonas Devlieghere case 4: {
633be960424SJonas Devlieghere const uint32_t uval32 = data.GetU32(&offset);
634be960424SJonas Devlieghere m_opcode.SetOpcode32(uval32, byte_order);
635be960424SJonas Devlieghere m_opcode_name.assign(".long");
636be960424SJonas Devlieghere mnemonic_strm.Printf("0x%8.8x", uval32);
637be960424SJonas Devlieghere } break;
638be960424SJonas Devlieghere case 8: {
639be960424SJonas Devlieghere const uint64_t uval64 = data.GetU64(&offset);
640be960424SJonas Devlieghere m_opcode.SetOpcode64(uval64, byte_order);
641be960424SJonas Devlieghere m_opcode_name.assign(".quad");
642be960424SJonas Devlieghere mnemonic_strm.Printf("0x%16.16" PRIx64, uval64);
643be960424SJonas Devlieghere } break;
644be960424SJonas Devlieghere default:
645be960424SJonas Devlieghere if (inst_size == 0)
646be960424SJonas Devlieghere return;
647be960424SJonas Devlieghere else {
648be960424SJonas Devlieghere const uint8_t *bytes = data.PeekData(offset, inst_size);
649be960424SJonas Devlieghere if (bytes == nullptr)
650be960424SJonas Devlieghere return;
651be960424SJonas Devlieghere m_opcode_name.assign(".byte");
652be960424SJonas Devlieghere m_opcode.SetOpcodeBytes(bytes, inst_size);
653be960424SJonas Devlieghere mnemonic_strm.Printf("0x%2.2x", bytes[0]);
654be960424SJonas Devlieghere for (uint32_t i = 1; i < inst_size; ++i)
655be960424SJonas Devlieghere mnemonic_strm.Printf(" 0x%2.2x", bytes[i]);
656be960424SJonas Devlieghere }
657be960424SJonas Devlieghere break;
658be960424SJonas Devlieghere }
659adcd0268SBenjamin Kramer m_mnemonics = std::string(mnemonic_strm.GetString());
660be960424SJonas Devlieghere return;
661be960424SJonas Devlieghere }
662be960424SJonas Devlieghere
663be960424SJonas Devlieghere static RegularExpression s_regex(
664be960424SJonas Devlieghere llvm::StringRef("[ \t]*([^ ^\t]+)[ \t]*([^ ^\t].*)?"));
665be960424SJonas Devlieghere
666be960424SJonas Devlieghere llvm::SmallVector<llvm::StringRef, 4> matches;
667be960424SJonas Devlieghere if (s_regex.Execute(out_string, &matches)) {
668be960424SJonas Devlieghere m_opcode_name = matches[1].str();
669be960424SJonas Devlieghere m_mnemonics = matches[2].str();
670be960424SJonas Devlieghere }
671be960424SJonas Devlieghere }
672be960424SJonas Devlieghere }
673be960424SJonas Devlieghere }
674be960424SJonas Devlieghere
IsValid() const675be960424SJonas Devlieghere bool IsValid() const { return m_is_valid; }
676be960424SJonas Devlieghere
UsingFileAddress() const677be960424SJonas Devlieghere bool UsingFileAddress() const { return m_using_file_addr; }
GetByteSize() const678be960424SJonas Devlieghere size_t GetByteSize() const { return m_opcode.GetByteSize(); }
679be960424SJonas Devlieghere
680be960424SJonas Devlieghere /// Grants exclusive access to the disassembler and initializes it with the
681be960424SJonas Devlieghere /// given InstructionLLVMC and an optional ExecutionContext.
682be960424SJonas Devlieghere class DisassemblerScope {
683be960424SJonas Devlieghere std::shared_ptr<DisassemblerLLVMC> m_disasm;
684be960424SJonas Devlieghere
685be960424SJonas Devlieghere public:
DisassemblerScope(InstructionLLVMC & i,const lldb_private::ExecutionContext * exe_ctx=nullptr)686be960424SJonas Devlieghere explicit DisassemblerScope(
687be960424SJonas Devlieghere InstructionLLVMC &i,
688be960424SJonas Devlieghere const lldb_private::ExecutionContext *exe_ctx = nullptr)
689be960424SJonas Devlieghere : m_disasm(i.m_disasm_wp.lock()) {
690be960424SJonas Devlieghere m_disasm->m_mutex.lock();
691be960424SJonas Devlieghere m_disasm->m_inst = &i;
692be960424SJonas Devlieghere m_disasm->m_exe_ctx = exe_ctx;
693be960424SJonas Devlieghere }
~DisassemblerScope()694be960424SJonas Devlieghere ~DisassemblerScope() { m_disasm->m_mutex.unlock(); }
695be960424SJonas Devlieghere
696be960424SJonas Devlieghere /// Evaluates to true if this scope contains a valid disassembler.
operator bool() const697be960424SJonas Devlieghere operator bool() const { return static_cast<bool>(m_disasm); }
698be960424SJonas Devlieghere
operator ->()699be960424SJonas Devlieghere std::shared_ptr<DisassemblerLLVMC> operator->() { return m_disasm; }
700be960424SJonas Devlieghere };
701be960424SJonas Devlieghere
702be960424SJonas Devlieghere static llvm::StringRef::const_iterator
ConsumeWhitespace(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)703be960424SJonas Devlieghere ConsumeWhitespace(llvm::StringRef::const_iterator osi,
704be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
705be960424SJonas Devlieghere while (osi != ose) {
706be960424SJonas Devlieghere switch (*osi) {
707be960424SJonas Devlieghere default:
708be960424SJonas Devlieghere return osi;
709be960424SJonas Devlieghere case ' ':
710be960424SJonas Devlieghere case '\t':
711be960424SJonas Devlieghere break;
712be960424SJonas Devlieghere }
713be960424SJonas Devlieghere ++osi;
714be960424SJonas Devlieghere }
715be960424SJonas Devlieghere
716be960424SJonas Devlieghere return osi;
717be960424SJonas Devlieghere }
718be960424SJonas Devlieghere
719be960424SJonas Devlieghere static std::pair<bool, llvm::StringRef::const_iterator>
ConsumeChar(llvm::StringRef::const_iterator osi,const char c,llvm::StringRef::const_iterator ose)720be960424SJonas Devlieghere ConsumeChar(llvm::StringRef::const_iterator osi, const char c,
721be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
722be960424SJonas Devlieghere bool found = false;
723be960424SJonas Devlieghere
724be960424SJonas Devlieghere osi = ConsumeWhitespace(osi, ose);
725be960424SJonas Devlieghere if (osi != ose && *osi == c) {
726be960424SJonas Devlieghere found = true;
727be960424SJonas Devlieghere ++osi;
728be960424SJonas Devlieghere }
729be960424SJonas Devlieghere
730be960424SJonas Devlieghere return std::make_pair(found, osi);
731be960424SJonas Devlieghere }
732be960424SJonas Devlieghere
733be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseRegisterName(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)734be960424SJonas Devlieghere ParseRegisterName(llvm::StringRef::const_iterator osi,
735be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
736be960424SJonas Devlieghere Operand ret;
737be960424SJonas Devlieghere ret.m_type = Operand::Type::Register;
738be960424SJonas Devlieghere std::string str;
739be960424SJonas Devlieghere
740be960424SJonas Devlieghere osi = ConsumeWhitespace(osi, ose);
741be960424SJonas Devlieghere
742be960424SJonas Devlieghere while (osi != ose) {
743be960424SJonas Devlieghere if (*osi >= '0' && *osi <= '9') {
744be960424SJonas Devlieghere if (str.empty()) {
745be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
746be960424SJonas Devlieghere } else {
747be960424SJonas Devlieghere str.push_back(*osi);
748be960424SJonas Devlieghere }
749be960424SJonas Devlieghere } else if (*osi >= 'a' && *osi <= 'z') {
750be960424SJonas Devlieghere str.push_back(*osi);
751be960424SJonas Devlieghere } else {
752be960424SJonas Devlieghere switch (*osi) {
753be960424SJonas Devlieghere default:
754be960424SJonas Devlieghere if (str.empty()) {
755be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
756be960424SJonas Devlieghere } else {
757be960424SJonas Devlieghere ret.m_register = ConstString(str);
758be960424SJonas Devlieghere return std::make_pair(ret, osi);
759be960424SJonas Devlieghere }
760be960424SJonas Devlieghere case '%':
761be960424SJonas Devlieghere if (!str.empty()) {
762be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
763be960424SJonas Devlieghere }
764be960424SJonas Devlieghere break;
765be960424SJonas Devlieghere }
766be960424SJonas Devlieghere }
767be960424SJonas Devlieghere ++osi;
768be960424SJonas Devlieghere }
769be960424SJonas Devlieghere
770be960424SJonas Devlieghere ret.m_register = ConstString(str);
771be960424SJonas Devlieghere return std::make_pair(ret, osi);
772be960424SJonas Devlieghere }
773be960424SJonas Devlieghere
774be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseImmediate(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)775be960424SJonas Devlieghere ParseImmediate(llvm::StringRef::const_iterator osi,
776be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
777be960424SJonas Devlieghere Operand ret;
778be960424SJonas Devlieghere ret.m_type = Operand::Type::Immediate;
779be960424SJonas Devlieghere std::string str;
780be960424SJonas Devlieghere bool is_hex = false;
781be960424SJonas Devlieghere
782be960424SJonas Devlieghere osi = ConsumeWhitespace(osi, ose);
783be960424SJonas Devlieghere
784be960424SJonas Devlieghere while (osi != ose) {
785be960424SJonas Devlieghere if (*osi >= '0' && *osi <= '9') {
786be960424SJonas Devlieghere str.push_back(*osi);
787be960424SJonas Devlieghere } else if (*osi >= 'a' && *osi <= 'f') {
788be960424SJonas Devlieghere if (is_hex) {
789be960424SJonas Devlieghere str.push_back(*osi);
790be960424SJonas Devlieghere } else {
791be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
792be960424SJonas Devlieghere }
793be960424SJonas Devlieghere } else {
794be960424SJonas Devlieghere switch (*osi) {
795be960424SJonas Devlieghere default:
796be960424SJonas Devlieghere if (str.empty()) {
797be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
798be960424SJonas Devlieghere } else {
799be960424SJonas Devlieghere ret.m_immediate = strtoull(str.c_str(), nullptr, 0);
800be960424SJonas Devlieghere return std::make_pair(ret, osi);
801be960424SJonas Devlieghere }
802be960424SJonas Devlieghere case 'x':
803be960424SJonas Devlieghere if (!str.compare("0")) {
804be960424SJonas Devlieghere is_hex = true;
805be960424SJonas Devlieghere str.push_back(*osi);
806be960424SJonas Devlieghere } else {
807be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
808be960424SJonas Devlieghere }
809be960424SJonas Devlieghere break;
810be960424SJonas Devlieghere case '#':
811be960424SJonas Devlieghere case '$':
812be960424SJonas Devlieghere if (!str.empty()) {
813be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
814be960424SJonas Devlieghere }
815be960424SJonas Devlieghere break;
816be960424SJonas Devlieghere case '-':
817be960424SJonas Devlieghere if (str.empty()) {
818be960424SJonas Devlieghere ret.m_negative = true;
819be960424SJonas Devlieghere } else {
820be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
821be960424SJonas Devlieghere }
822be960424SJonas Devlieghere }
823be960424SJonas Devlieghere }
824be960424SJonas Devlieghere ++osi;
825be960424SJonas Devlieghere }
826be960424SJonas Devlieghere
827be960424SJonas Devlieghere ret.m_immediate = strtoull(str.c_str(), nullptr, 0);
828be960424SJonas Devlieghere return std::make_pair(ret, osi);
829be960424SJonas Devlieghere }
830be960424SJonas Devlieghere
831be960424SJonas Devlieghere // -0x5(%rax,%rax,2)
832be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseIntelIndexedAccess(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)833be960424SJonas Devlieghere ParseIntelIndexedAccess(llvm::StringRef::const_iterator osi,
834be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
835be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> offset_and_iterator =
836be960424SJonas Devlieghere ParseImmediate(osi, ose);
837be960424SJonas Devlieghere if (offset_and_iterator.first.IsValid()) {
838be960424SJonas Devlieghere osi = offset_and_iterator.second;
839be960424SJonas Devlieghere }
840be960424SJonas Devlieghere
841be960424SJonas Devlieghere bool found = false;
842be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, '(', ose);
843be960424SJonas Devlieghere if (!found) {
844be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
845be960424SJonas Devlieghere }
846be960424SJonas Devlieghere
847be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> base_and_iterator =
848be960424SJonas Devlieghere ParseRegisterName(osi, ose);
849be960424SJonas Devlieghere if (base_and_iterator.first.IsValid()) {
850be960424SJonas Devlieghere osi = base_and_iterator.second;
851be960424SJonas Devlieghere } else {
852be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
853be960424SJonas Devlieghere }
854be960424SJonas Devlieghere
855be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ',', ose);
856be960424SJonas Devlieghere if (!found) {
857be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
858be960424SJonas Devlieghere }
859be960424SJonas Devlieghere
860be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> index_and_iterator =
861be960424SJonas Devlieghere ParseRegisterName(osi, ose);
862be960424SJonas Devlieghere if (index_and_iterator.first.IsValid()) {
863be960424SJonas Devlieghere osi = index_and_iterator.second;
864be960424SJonas Devlieghere } else {
865be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
866be960424SJonas Devlieghere }
867be960424SJonas Devlieghere
868be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ',', ose);
869be960424SJonas Devlieghere if (!found) {
870be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
871be960424SJonas Devlieghere }
872be960424SJonas Devlieghere
873be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator>
874be960424SJonas Devlieghere multiplier_and_iterator = ParseImmediate(osi, ose);
875be960424SJonas Devlieghere if (index_and_iterator.first.IsValid()) {
876be960424SJonas Devlieghere osi = index_and_iterator.second;
877be960424SJonas Devlieghere } else {
878be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
879be960424SJonas Devlieghere }
880be960424SJonas Devlieghere
881be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ')', ose);
882be960424SJonas Devlieghere if (!found) {
883be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
884be960424SJonas Devlieghere }
885be960424SJonas Devlieghere
886be960424SJonas Devlieghere Operand product;
887be960424SJonas Devlieghere product.m_type = Operand::Type::Product;
888be960424SJonas Devlieghere product.m_children.push_back(index_and_iterator.first);
889be960424SJonas Devlieghere product.m_children.push_back(multiplier_and_iterator.first);
890be960424SJonas Devlieghere
891be960424SJonas Devlieghere Operand index;
892be960424SJonas Devlieghere index.m_type = Operand::Type::Sum;
893be960424SJonas Devlieghere index.m_children.push_back(base_and_iterator.first);
894be960424SJonas Devlieghere index.m_children.push_back(product);
895be960424SJonas Devlieghere
896be960424SJonas Devlieghere if (offset_and_iterator.first.IsValid()) {
897be960424SJonas Devlieghere Operand offset;
898be960424SJonas Devlieghere offset.m_type = Operand::Type::Sum;
899be960424SJonas Devlieghere offset.m_children.push_back(offset_and_iterator.first);
900be960424SJonas Devlieghere offset.m_children.push_back(index);
901be960424SJonas Devlieghere
902be960424SJonas Devlieghere Operand deref;
903be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
904be960424SJonas Devlieghere deref.m_children.push_back(offset);
905be960424SJonas Devlieghere return std::make_pair(deref, osi);
906be960424SJonas Devlieghere } else {
907be960424SJonas Devlieghere Operand deref;
908be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
909be960424SJonas Devlieghere deref.m_children.push_back(index);
910be960424SJonas Devlieghere return std::make_pair(deref, osi);
911be960424SJonas Devlieghere }
912be960424SJonas Devlieghere }
913be960424SJonas Devlieghere
914be960424SJonas Devlieghere // -0x10(%rbp)
915be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseIntelDerefAccess(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)916be960424SJonas Devlieghere ParseIntelDerefAccess(llvm::StringRef::const_iterator osi,
917be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
918be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> offset_and_iterator =
919be960424SJonas Devlieghere ParseImmediate(osi, ose);
920be960424SJonas Devlieghere if (offset_and_iterator.first.IsValid()) {
921be960424SJonas Devlieghere osi = offset_and_iterator.second;
922be960424SJonas Devlieghere }
923be960424SJonas Devlieghere
924be960424SJonas Devlieghere bool found = false;
925be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, '(', ose);
926be960424SJonas Devlieghere if (!found) {
927be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
928be960424SJonas Devlieghere }
929be960424SJonas Devlieghere
930be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> base_and_iterator =
931be960424SJonas Devlieghere ParseRegisterName(osi, ose);
932be960424SJonas Devlieghere if (base_and_iterator.first.IsValid()) {
933be960424SJonas Devlieghere osi = base_and_iterator.second;
934be960424SJonas Devlieghere } else {
935be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
936be960424SJonas Devlieghere }
937be960424SJonas Devlieghere
938be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ')', ose);
939be960424SJonas Devlieghere if (!found) {
940be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
941be960424SJonas Devlieghere }
942be960424SJonas Devlieghere
943be960424SJonas Devlieghere if (offset_and_iterator.first.IsValid()) {
944be960424SJonas Devlieghere Operand offset;
945be960424SJonas Devlieghere offset.m_type = Operand::Type::Sum;
946be960424SJonas Devlieghere offset.m_children.push_back(offset_and_iterator.first);
947be960424SJonas Devlieghere offset.m_children.push_back(base_and_iterator.first);
948be960424SJonas Devlieghere
949be960424SJonas Devlieghere Operand deref;
950be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
951be960424SJonas Devlieghere deref.m_children.push_back(offset);
952be960424SJonas Devlieghere return std::make_pair(deref, osi);
953be960424SJonas Devlieghere } else {
954be960424SJonas Devlieghere Operand deref;
955be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
956be960424SJonas Devlieghere deref.m_children.push_back(base_and_iterator.first);
957be960424SJonas Devlieghere return std::make_pair(deref, osi);
958be960424SJonas Devlieghere }
959be960424SJonas Devlieghere }
960be960424SJonas Devlieghere
961be960424SJonas Devlieghere // [sp, #8]!
962be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseARMOffsetAccess(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)963be960424SJonas Devlieghere ParseARMOffsetAccess(llvm::StringRef::const_iterator osi,
964be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
965be960424SJonas Devlieghere bool found = false;
966be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, '[', ose);
967be960424SJonas Devlieghere if (!found) {
968be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
969be960424SJonas Devlieghere }
970be960424SJonas Devlieghere
971be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> base_and_iterator =
972be960424SJonas Devlieghere ParseRegisterName(osi, ose);
973be960424SJonas Devlieghere if (base_and_iterator.first.IsValid()) {
974be960424SJonas Devlieghere osi = base_and_iterator.second;
975be960424SJonas Devlieghere } else {
976be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
977be960424SJonas Devlieghere }
978be960424SJonas Devlieghere
979be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ',', ose);
980be960424SJonas Devlieghere if (!found) {
981be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
982be960424SJonas Devlieghere }
983be960424SJonas Devlieghere
984be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> offset_and_iterator =
985be960424SJonas Devlieghere ParseImmediate(osi, ose);
986be960424SJonas Devlieghere if (offset_and_iterator.first.IsValid()) {
987be960424SJonas Devlieghere osi = offset_and_iterator.second;
988be960424SJonas Devlieghere }
989be960424SJonas Devlieghere
990be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ']', ose);
991be960424SJonas Devlieghere if (!found) {
992be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
993be960424SJonas Devlieghere }
994be960424SJonas Devlieghere
995be960424SJonas Devlieghere Operand offset;
996be960424SJonas Devlieghere offset.m_type = Operand::Type::Sum;
997be960424SJonas Devlieghere offset.m_children.push_back(offset_and_iterator.first);
998be960424SJonas Devlieghere offset.m_children.push_back(base_and_iterator.first);
999be960424SJonas Devlieghere
1000be960424SJonas Devlieghere Operand deref;
1001be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
1002be960424SJonas Devlieghere deref.m_children.push_back(offset);
1003be960424SJonas Devlieghere return std::make_pair(deref, osi);
1004be960424SJonas Devlieghere }
1005be960424SJonas Devlieghere
1006be960424SJonas Devlieghere // [sp]
1007be960424SJonas Devlieghere static std::pair<Operand, llvm::StringRef::const_iterator>
ParseARMDerefAccess(llvm::StringRef::const_iterator osi,llvm::StringRef::const_iterator ose)1008be960424SJonas Devlieghere ParseARMDerefAccess(llvm::StringRef::const_iterator osi,
1009be960424SJonas Devlieghere llvm::StringRef::const_iterator ose) {
1010be960424SJonas Devlieghere bool found = false;
1011be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, '[', ose);
1012be960424SJonas Devlieghere if (!found) {
1013be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
1014be960424SJonas Devlieghere }
1015be960424SJonas Devlieghere
1016be960424SJonas Devlieghere std::pair<Operand, llvm::StringRef::const_iterator> base_and_iterator =
1017be960424SJonas Devlieghere ParseRegisterName(osi, ose);
1018be960424SJonas Devlieghere if (base_and_iterator.first.IsValid()) {
1019be960424SJonas Devlieghere osi = base_and_iterator.second;
1020be960424SJonas Devlieghere } else {
1021be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
1022be960424SJonas Devlieghere }
1023be960424SJonas Devlieghere
1024be960424SJonas Devlieghere std::tie(found, osi) = ConsumeChar(osi, ']', ose);
1025be960424SJonas Devlieghere if (!found) {
1026be960424SJonas Devlieghere return std::make_pair(Operand(), osi);
1027be960424SJonas Devlieghere }
1028be960424SJonas Devlieghere
1029be960424SJonas Devlieghere Operand deref;
1030be960424SJonas Devlieghere deref.m_type = Operand::Type::Dereference;
1031be960424SJonas Devlieghere deref.m_children.push_back(base_and_iterator.first);
1032be960424SJonas Devlieghere return std::make_pair(deref, osi);
1033be960424SJonas Devlieghere }
1034be960424SJonas Devlieghere
DumpOperand(const Operand & op,Stream & s)1035be960424SJonas Devlieghere static void DumpOperand(const Operand &op, Stream &s) {
1036be960424SJonas Devlieghere switch (op.m_type) {
1037be960424SJonas Devlieghere case Operand::Type::Dereference:
1038be960424SJonas Devlieghere s.PutCString("*");
1039be960424SJonas Devlieghere DumpOperand(op.m_children[0], s);
1040be960424SJonas Devlieghere break;
1041be960424SJonas Devlieghere case Operand::Type::Immediate:
1042be960424SJonas Devlieghere if (op.m_negative) {
1043be960424SJonas Devlieghere s.PutCString("-");
1044be960424SJonas Devlieghere }
1045be960424SJonas Devlieghere s.PutCString(llvm::to_string(op.m_immediate));
1046be960424SJonas Devlieghere break;
1047be960424SJonas Devlieghere case Operand::Type::Invalid:
1048be960424SJonas Devlieghere s.PutCString("Invalid");
1049be960424SJonas Devlieghere break;
1050be960424SJonas Devlieghere case Operand::Type::Product:
1051be960424SJonas Devlieghere s.PutCString("(");
1052be960424SJonas Devlieghere DumpOperand(op.m_children[0], s);
1053be960424SJonas Devlieghere s.PutCString("*");
1054be960424SJonas Devlieghere DumpOperand(op.m_children[1], s);
1055be960424SJonas Devlieghere s.PutCString(")");
1056be960424SJonas Devlieghere break;
1057be960424SJonas Devlieghere case Operand::Type::Register:
1058642bc15dSRaphael Isemann s.PutCString(op.m_register.GetStringRef());
1059be960424SJonas Devlieghere break;
1060be960424SJonas Devlieghere case Operand::Type::Sum:
1061be960424SJonas Devlieghere s.PutCString("(");
1062be960424SJonas Devlieghere DumpOperand(op.m_children[0], s);
1063be960424SJonas Devlieghere s.PutCString("+");
1064be960424SJonas Devlieghere DumpOperand(op.m_children[1], s);
1065be960424SJonas Devlieghere s.PutCString(")");
1066be960424SJonas Devlieghere break;
1067be960424SJonas Devlieghere }
1068be960424SJonas Devlieghere }
1069be960424SJonas Devlieghere
ParseOperands(llvm::SmallVectorImpl<Instruction::Operand> & operands)1070be960424SJonas Devlieghere bool ParseOperands(
1071be960424SJonas Devlieghere llvm::SmallVectorImpl<Instruction::Operand> &operands) override {
1072be960424SJonas Devlieghere const char *operands_string = GetOperands(nullptr);
1073be960424SJonas Devlieghere
1074be960424SJonas Devlieghere if (!operands_string) {
1075be960424SJonas Devlieghere return false;
1076be960424SJonas Devlieghere }
1077be960424SJonas Devlieghere
1078be960424SJonas Devlieghere llvm::StringRef operands_ref(operands_string);
1079be960424SJonas Devlieghere
1080be960424SJonas Devlieghere llvm::StringRef::const_iterator osi = operands_ref.begin();
1081be960424SJonas Devlieghere llvm::StringRef::const_iterator ose = operands_ref.end();
1082be960424SJonas Devlieghere
1083be960424SJonas Devlieghere while (osi != ose) {
1084be960424SJonas Devlieghere Operand operand;
1085be960424SJonas Devlieghere llvm::StringRef::const_iterator iter;
1086be960424SJonas Devlieghere
1087be960424SJonas Devlieghere if ((std::tie(operand, iter) = ParseIntelIndexedAccess(osi, ose),
1088be960424SJonas Devlieghere operand.IsValid()) ||
1089be960424SJonas Devlieghere (std::tie(operand, iter) = ParseIntelDerefAccess(osi, ose),
1090be960424SJonas Devlieghere operand.IsValid()) ||
1091be960424SJonas Devlieghere (std::tie(operand, iter) = ParseARMOffsetAccess(osi, ose),
1092be960424SJonas Devlieghere operand.IsValid()) ||
1093be960424SJonas Devlieghere (std::tie(operand, iter) = ParseARMDerefAccess(osi, ose),
1094be960424SJonas Devlieghere operand.IsValid()) ||
1095be960424SJonas Devlieghere (std::tie(operand, iter) = ParseRegisterName(osi, ose),
1096be960424SJonas Devlieghere operand.IsValid()) ||
1097be960424SJonas Devlieghere (std::tie(operand, iter) = ParseImmediate(osi, ose),
1098be960424SJonas Devlieghere operand.IsValid())) {
1099be960424SJonas Devlieghere osi = iter;
1100be960424SJonas Devlieghere operands.push_back(operand);
1101be960424SJonas Devlieghere } else {
1102be960424SJonas Devlieghere return false;
1103be960424SJonas Devlieghere }
1104be960424SJonas Devlieghere
1105be960424SJonas Devlieghere std::pair<bool, llvm::StringRef::const_iterator> found_and_iter =
1106be960424SJonas Devlieghere ConsumeChar(osi, ',', ose);
1107be960424SJonas Devlieghere if (found_and_iter.first) {
1108be960424SJonas Devlieghere osi = found_and_iter.second;
1109be960424SJonas Devlieghere }
1110be960424SJonas Devlieghere
1111be960424SJonas Devlieghere osi = ConsumeWhitespace(osi, ose);
1112be960424SJonas Devlieghere }
1113be960424SJonas Devlieghere
1114be960424SJonas Devlieghere DisassemblerSP disasm_sp = m_disasm_wp.lock();
1115be960424SJonas Devlieghere
1116be960424SJonas Devlieghere if (disasm_sp && operands.size() > 1) {
1117be960424SJonas Devlieghere // TODO tie this into the MC Disassembler's notion of clobbers.
1118be960424SJonas Devlieghere switch (disasm_sp->GetArchitecture().GetMachine()) {
1119be960424SJonas Devlieghere default:
1120be960424SJonas Devlieghere break;
1121be960424SJonas Devlieghere case llvm::Triple::x86:
1122be960424SJonas Devlieghere case llvm::Triple::x86_64:
1123be960424SJonas Devlieghere operands[operands.size() - 1].m_clobbered = true;
1124be960424SJonas Devlieghere break;
1125be960424SJonas Devlieghere case llvm::Triple::arm:
1126be960424SJonas Devlieghere operands[0].m_clobbered = true;
1127be960424SJonas Devlieghere break;
1128be960424SJonas Devlieghere }
1129be960424SJonas Devlieghere }
1130be960424SJonas Devlieghere
1131a007a6d8SPavel Labath if (Log *log = GetLog(LLDBLog::Process)) {
1132be960424SJonas Devlieghere StreamString ss;
1133be960424SJonas Devlieghere
1134be960424SJonas Devlieghere ss.Printf("[%s] expands to %zu operands:\n", operands_string,
1135be960424SJonas Devlieghere operands.size());
1136be960424SJonas Devlieghere for (const Operand &operand : operands) {
1137be960424SJonas Devlieghere ss.PutCString(" ");
1138be960424SJonas Devlieghere DumpOperand(operand, ss);
1139be960424SJonas Devlieghere ss.PutCString("\n");
1140be960424SJonas Devlieghere }
1141be960424SJonas Devlieghere
1142be960424SJonas Devlieghere log->PutString(ss.GetString());
1143be960424SJonas Devlieghere }
1144be960424SJonas Devlieghere
1145be960424SJonas Devlieghere return true;
1146be960424SJonas Devlieghere }
1147be960424SJonas Devlieghere
IsCall()1148be960424SJonas Devlieghere bool IsCall() override {
1149009e3e53SVedant Kumar VisitInstruction();
1150009e3e53SVedant Kumar return m_is_call;
1151009e3e53SVedant Kumar }
1152009e3e53SVedant Kumar
1153009e3e53SVedant Kumar protected:
1154009e3e53SVedant Kumar std::weak_ptr<DisassemblerLLVMC> m_disasm_wp;
1155009e3e53SVedant Kumar
1156009e3e53SVedant Kumar bool m_is_valid = false;
115728c878aeSShafik Yaghmour bool m_using_file_addr = false;
1158009e3e53SVedant Kumar bool m_has_visited_instruction = false;
1159009e3e53SVedant Kumar
1160009e3e53SVedant Kumar // Be conservative. If we didn't understand the instruction, say it:
1161009e3e53SVedant Kumar // - Might branch
1162009e3e53SVedant Kumar // - Does not have a delay slot
1163009e3e53SVedant Kumar // - Is not a call
116466902a32SVedant Kumar // - Is not a load
116566902a32SVedant Kumar // - Is not an authenticated instruction
1166009e3e53SVedant Kumar bool m_does_branch = true;
1167009e3e53SVedant Kumar bool m_has_delay_slot = false;
1168009e3e53SVedant Kumar bool m_is_call = false;
116966902a32SVedant Kumar bool m_is_load = false;
117066902a32SVedant Kumar bool m_is_authenticated = false;
1171009e3e53SVedant Kumar
VisitInstruction()1172009e3e53SVedant Kumar void VisitInstruction() {
1173009e3e53SVedant Kumar if (m_has_visited_instruction)
1174009e3e53SVedant Kumar return;
1175009e3e53SVedant Kumar
1176be960424SJonas Devlieghere DisassemblerScope disasm(*this);
1177009e3e53SVedant Kumar if (!disasm)
1178009e3e53SVedant Kumar return;
1179009e3e53SVedant Kumar
1180be960424SJonas Devlieghere DataExtractor data;
1181009e3e53SVedant Kumar if (!m_opcode.GetData(data))
1182009e3e53SVedant Kumar return;
1183009e3e53SVedant Kumar
1184be960424SJonas Devlieghere bool is_alternate_isa;
1185be960424SJonas Devlieghere lldb::addr_t pc = m_address.GetFileAddress();
1186be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance *mc_disasm_ptr =
1187be960424SJonas Devlieghere GetDisasmToUse(is_alternate_isa, disasm);
1188be960424SJonas Devlieghere const uint8_t *opcode_data = data.GetDataStart();
1189be960424SJonas Devlieghere const size_t opcode_data_len = data.GetByteSize();
1190be960424SJonas Devlieghere llvm::MCInst inst;
1191be960424SJonas Devlieghere const size_t inst_size =
1192be960424SJonas Devlieghere mc_disasm_ptr->GetMCInst(opcode_data, opcode_data_len, pc, inst);
1193009e3e53SVedant Kumar if (inst_size == 0)
1194009e3e53SVedant Kumar return;
1195be960424SJonas Devlieghere
1196009e3e53SVedant Kumar m_has_visited_instruction = true;
1197009e3e53SVedant Kumar m_does_branch = mc_disasm_ptr->CanBranch(inst);
1198009e3e53SVedant Kumar m_has_delay_slot = mc_disasm_ptr->HasDelaySlot(inst);
1199009e3e53SVedant Kumar m_is_call = mc_disasm_ptr->IsCall(inst);
120066902a32SVedant Kumar m_is_load = mc_disasm_ptr->IsLoad(inst);
120166902a32SVedant Kumar m_is_authenticated = mc_disasm_ptr->IsAuthenticated(inst);
1202009e3e53SVedant Kumar }
1203be960424SJonas Devlieghere
1204be960424SJonas Devlieghere private:
1205be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance *
GetDisasmToUse(bool & is_alternate_isa,DisassemblerScope & disasm)1206be960424SJonas Devlieghere GetDisasmToUse(bool &is_alternate_isa, DisassemblerScope &disasm) {
1207be960424SJonas Devlieghere is_alternate_isa = false;
1208be960424SJonas Devlieghere if (disasm) {
1209be960424SJonas Devlieghere if (disasm->m_alternate_disasm_up) {
1210be960424SJonas Devlieghere const AddressClass address_class = GetAddressClass();
1211be960424SJonas Devlieghere
1212be960424SJonas Devlieghere if (address_class == AddressClass::eCodeAlternateISA) {
1213be960424SJonas Devlieghere is_alternate_isa = true;
1214be960424SJonas Devlieghere return disasm->m_alternate_disasm_up.get();
1215be960424SJonas Devlieghere }
1216be960424SJonas Devlieghere }
1217be960424SJonas Devlieghere return disasm->m_disasm_up.get();
1218be960424SJonas Devlieghere }
1219be960424SJonas Devlieghere return nullptr;
1220be960424SJonas Devlieghere }
1221be960424SJonas Devlieghere };
1222be960424SJonas Devlieghere
1223be960424SJonas Devlieghere std::unique_ptr<DisassemblerLLVMC::MCDisasmInstance>
Create(const char * triple,const char * cpu,const char * features_str,unsigned flavor,DisassemblerLLVMC & owner)1224be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance::Create(const char *triple, const char *cpu,
1225be960424SJonas Devlieghere const char *features_str,
1226be960424SJonas Devlieghere unsigned flavor,
1227be960424SJonas Devlieghere DisassemblerLLVMC &owner) {
1228be960424SJonas Devlieghere using Instance = std::unique_ptr<DisassemblerLLVMC::MCDisasmInstance>;
1229be960424SJonas Devlieghere
1230be960424SJonas Devlieghere std::string Status;
1231be960424SJonas Devlieghere const llvm::Target *curr_target =
1232be960424SJonas Devlieghere llvm::TargetRegistry::lookupTarget(triple, Status);
1233be960424SJonas Devlieghere if (!curr_target)
1234be960424SJonas Devlieghere return Instance();
1235be960424SJonas Devlieghere
1236be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstrInfo> instr_info_up(
1237be960424SJonas Devlieghere curr_target->createMCInstrInfo());
1238be960424SJonas Devlieghere if (!instr_info_up)
1239be960424SJonas Devlieghere return Instance();
1240be960424SJonas Devlieghere
1241be960424SJonas Devlieghere std::unique_ptr<llvm::MCRegisterInfo> reg_info_up(
1242be960424SJonas Devlieghere curr_target->createMCRegInfo(triple));
1243be960424SJonas Devlieghere if (!reg_info_up)
1244be960424SJonas Devlieghere return Instance();
1245be960424SJonas Devlieghere
1246be960424SJonas Devlieghere std::unique_ptr<llvm::MCSubtargetInfo> subtarget_info_up(
1247be960424SJonas Devlieghere curr_target->createMCSubtargetInfo(triple, cpu, features_str));
1248be960424SJonas Devlieghere if (!subtarget_info_up)
1249be960424SJonas Devlieghere return Instance();
1250be960424SJonas Devlieghere
1251be960424SJonas Devlieghere llvm::MCTargetOptions MCOptions;
1252be960424SJonas Devlieghere std::unique_ptr<llvm::MCAsmInfo> asm_info_up(
1253be960424SJonas Devlieghere curr_target->createMCAsmInfo(*reg_info_up, triple, MCOptions));
1254be960424SJonas Devlieghere if (!asm_info_up)
1255be960424SJonas Devlieghere return Instance();
1256be960424SJonas Devlieghere
1257c2f819afSPhilipp Krones std::unique_ptr<llvm::MCContext> context_up(
1258c2f819afSPhilipp Krones new llvm::MCContext(llvm::Triple(triple), asm_info_up.get(),
1259c2f819afSPhilipp Krones reg_info_up.get(), subtarget_info_up.get()));
1260be960424SJonas Devlieghere if (!context_up)
1261be960424SJonas Devlieghere return Instance();
1262be960424SJonas Devlieghere
1263be960424SJonas Devlieghere std::unique_ptr<llvm::MCDisassembler> disasm_up(
1264be960424SJonas Devlieghere curr_target->createMCDisassembler(*subtarget_info_up, *context_up));
1265be960424SJonas Devlieghere if (!disasm_up)
1266be960424SJonas Devlieghere return Instance();
1267be960424SJonas Devlieghere
1268be960424SJonas Devlieghere std::unique_ptr<llvm::MCRelocationInfo> rel_info_up(
1269be960424SJonas Devlieghere curr_target->createMCRelocationInfo(triple, *context_up));
1270be960424SJonas Devlieghere if (!rel_info_up)
1271be960424SJonas Devlieghere return Instance();
1272be960424SJonas Devlieghere
1273be960424SJonas Devlieghere std::unique_ptr<llvm::MCSymbolizer> symbolizer_up(
1274be960424SJonas Devlieghere curr_target->createMCSymbolizer(
1275be960424SJonas Devlieghere triple, nullptr, DisassemblerLLVMC::SymbolLookupCallback, &owner,
1276be960424SJonas Devlieghere context_up.get(), std::move(rel_info_up)));
1277be960424SJonas Devlieghere disasm_up->setSymbolizer(std::move(symbolizer_up));
1278be960424SJonas Devlieghere
1279be960424SJonas Devlieghere unsigned asm_printer_variant =
1280be960424SJonas Devlieghere flavor == ~0U ? asm_info_up->getAssemblerDialect() : flavor;
1281be960424SJonas Devlieghere
1282be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstPrinter> instr_printer_up(
1283be960424SJonas Devlieghere curr_target->createMCInstPrinter(llvm::Triple{triple},
1284be960424SJonas Devlieghere asm_printer_variant, *asm_info_up,
1285be960424SJonas Devlieghere *instr_info_up, *reg_info_up));
1286be960424SJonas Devlieghere if (!instr_printer_up)
1287be960424SJonas Devlieghere return Instance();
1288be960424SJonas Devlieghere
1289be960424SJonas Devlieghere return Instance(
1290be960424SJonas Devlieghere new MCDisasmInstance(std::move(instr_info_up), std::move(reg_info_up),
1291be960424SJonas Devlieghere std::move(subtarget_info_up), std::move(asm_info_up),
1292be960424SJonas Devlieghere std::move(context_up), std::move(disasm_up),
1293be960424SJonas Devlieghere std::move(instr_printer_up)));
1294be960424SJonas Devlieghere }
1295be960424SJonas Devlieghere
MCDisasmInstance(std::unique_ptr<llvm::MCInstrInfo> && instr_info_up,std::unique_ptr<llvm::MCRegisterInfo> && reg_info_up,std::unique_ptr<llvm::MCSubtargetInfo> && subtarget_info_up,std::unique_ptr<llvm::MCAsmInfo> && asm_info_up,std::unique_ptr<llvm::MCContext> && context_up,std::unique_ptr<llvm::MCDisassembler> && disasm_up,std::unique_ptr<llvm::MCInstPrinter> && instr_printer_up)1296be960424SJonas Devlieghere DisassemblerLLVMC::MCDisasmInstance::MCDisasmInstance(
1297be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstrInfo> &&instr_info_up,
1298be960424SJonas Devlieghere std::unique_ptr<llvm::MCRegisterInfo> &®_info_up,
1299be960424SJonas Devlieghere std::unique_ptr<llvm::MCSubtargetInfo> &&subtarget_info_up,
1300be960424SJonas Devlieghere std::unique_ptr<llvm::MCAsmInfo> &&asm_info_up,
1301be960424SJonas Devlieghere std::unique_ptr<llvm::MCContext> &&context_up,
1302be960424SJonas Devlieghere std::unique_ptr<llvm::MCDisassembler> &&disasm_up,
1303be960424SJonas Devlieghere std::unique_ptr<llvm::MCInstPrinter> &&instr_printer_up)
1304be960424SJonas Devlieghere : m_instr_info_up(std::move(instr_info_up)),
1305be960424SJonas Devlieghere m_reg_info_up(std::move(reg_info_up)),
1306be960424SJonas Devlieghere m_subtarget_info_up(std::move(subtarget_info_up)),
1307be960424SJonas Devlieghere m_asm_info_up(std::move(asm_info_up)),
1308be960424SJonas Devlieghere m_context_up(std::move(context_up)), m_disasm_up(std::move(disasm_up)),
1309be960424SJonas Devlieghere m_instr_printer_up(std::move(instr_printer_up)) {
1310be960424SJonas Devlieghere assert(m_instr_info_up && m_reg_info_up && m_subtarget_info_up &&
1311be960424SJonas Devlieghere m_asm_info_up && m_context_up && m_disasm_up && m_instr_printer_up);
1312be960424SJonas Devlieghere }
1313be960424SJonas Devlieghere
GetMCInst(const uint8_t * opcode_data,size_t opcode_data_len,lldb::addr_t pc,llvm::MCInst & mc_inst) const1314be960424SJonas Devlieghere uint64_t DisassemblerLLVMC::MCDisasmInstance::GetMCInst(
1315be960424SJonas Devlieghere const uint8_t *opcode_data, size_t opcode_data_len, lldb::addr_t pc,
1316be960424SJonas Devlieghere llvm::MCInst &mc_inst) const {
1317be960424SJonas Devlieghere llvm::ArrayRef<uint8_t> data(opcode_data, opcode_data_len);
1318be960424SJonas Devlieghere llvm::MCDisassembler::DecodeStatus status;
1319be960424SJonas Devlieghere
1320be960424SJonas Devlieghere uint64_t new_inst_size;
1321be960424SJonas Devlieghere status = m_disasm_up->getInstruction(mc_inst, new_inst_size, data, pc,
1322be960424SJonas Devlieghere llvm::nulls());
1323be960424SJonas Devlieghere if (status == llvm::MCDisassembler::Success)
1324be960424SJonas Devlieghere return new_inst_size;
1325be960424SJonas Devlieghere else
1326be960424SJonas Devlieghere return 0;
1327be960424SJonas Devlieghere }
1328be960424SJonas Devlieghere
PrintMCInst(llvm::MCInst & mc_inst,std::string & inst_string,std::string & comments_string)1329be960424SJonas Devlieghere void DisassemblerLLVMC::MCDisasmInstance::PrintMCInst(
1330be960424SJonas Devlieghere llvm::MCInst &mc_inst, std::string &inst_string,
1331be960424SJonas Devlieghere std::string &comments_string) {
1332be960424SJonas Devlieghere llvm::raw_string_ostream inst_stream(inst_string);
1333be960424SJonas Devlieghere llvm::raw_string_ostream comments_stream(comments_string);
1334be960424SJonas Devlieghere
1335be960424SJonas Devlieghere m_instr_printer_up->setCommentStream(comments_stream);
1336be960424SJonas Devlieghere m_instr_printer_up->printInst(&mc_inst, 0, llvm::StringRef(),
1337be960424SJonas Devlieghere *m_subtarget_info_up, inst_stream);
1338be960424SJonas Devlieghere m_instr_printer_up->setCommentStream(llvm::nulls());
1339be960424SJonas Devlieghere comments_stream.flush();
1340be960424SJonas Devlieghere
1341be960424SJonas Devlieghere static std::string g_newlines("\r\n");
1342be960424SJonas Devlieghere
1343be960424SJonas Devlieghere for (size_t newline_pos = 0;
1344be960424SJonas Devlieghere (newline_pos = comments_string.find_first_of(g_newlines, newline_pos)) !=
1345be960424SJonas Devlieghere comments_string.npos;
1346be960424SJonas Devlieghere /**/) {
1347be960424SJonas Devlieghere comments_string.replace(comments_string.begin() + newline_pos,
1348be960424SJonas Devlieghere comments_string.begin() + newline_pos + 1, 1, ' ');
1349be960424SJonas Devlieghere }
1350be960424SJonas Devlieghere }
1351be960424SJonas Devlieghere
SetStyle(bool use_hex_immed,HexImmediateStyle hex_style)1352be960424SJonas Devlieghere void DisassemblerLLVMC::MCDisasmInstance::SetStyle(
1353be960424SJonas Devlieghere bool use_hex_immed, HexImmediateStyle hex_style) {
1354be960424SJonas Devlieghere m_instr_printer_up->setPrintImmHex(use_hex_immed);
1355be960424SJonas Devlieghere switch (hex_style) {
1356be960424SJonas Devlieghere case eHexStyleC:
1357be960424SJonas Devlieghere m_instr_printer_up->setPrintHexStyle(llvm::HexStyle::C);
1358be960424SJonas Devlieghere break;
1359be960424SJonas Devlieghere case eHexStyleAsm:
1360be960424SJonas Devlieghere m_instr_printer_up->setPrintHexStyle(llvm::HexStyle::Asm);
1361be960424SJonas Devlieghere break;
1362be960424SJonas Devlieghere }
1363be960424SJonas Devlieghere }
1364be960424SJonas Devlieghere
CanBranch(llvm::MCInst & mc_inst) const1365be960424SJonas Devlieghere bool DisassemblerLLVMC::MCDisasmInstance::CanBranch(
1366be960424SJonas Devlieghere llvm::MCInst &mc_inst) const {
1367be960424SJonas Devlieghere return m_instr_info_up->get(mc_inst.getOpcode())
1368be960424SJonas Devlieghere .mayAffectControlFlow(mc_inst, *m_reg_info_up);
1369be960424SJonas Devlieghere }
1370be960424SJonas Devlieghere
HasDelaySlot(llvm::MCInst & mc_inst) const1371be960424SJonas Devlieghere bool DisassemblerLLVMC::MCDisasmInstance::HasDelaySlot(
1372be960424SJonas Devlieghere llvm::MCInst &mc_inst) const {
1373be960424SJonas Devlieghere return m_instr_info_up->get(mc_inst.getOpcode()).hasDelaySlot();
1374be960424SJonas Devlieghere }
1375be960424SJonas Devlieghere
IsCall(llvm::MCInst & mc_inst) const1376be960424SJonas Devlieghere bool DisassemblerLLVMC::MCDisasmInstance::IsCall(llvm::MCInst &mc_inst) const {
1377be960424SJonas Devlieghere return m_instr_info_up->get(mc_inst.getOpcode()).isCall();
1378be960424SJonas Devlieghere }
1379be960424SJonas Devlieghere
IsLoad(llvm::MCInst & mc_inst) const138066902a32SVedant Kumar bool DisassemblerLLVMC::MCDisasmInstance::IsLoad(llvm::MCInst &mc_inst) const {
138166902a32SVedant Kumar return m_instr_info_up->get(mc_inst.getOpcode()).mayLoad();
138266902a32SVedant Kumar }
138366902a32SVedant Kumar
IsAuthenticated(llvm::MCInst & mc_inst) const138466902a32SVedant Kumar bool DisassemblerLLVMC::MCDisasmInstance::IsAuthenticated(
138566902a32SVedant Kumar llvm::MCInst &mc_inst) const {
138666902a32SVedant Kumar auto InstrDesc = m_instr_info_up->get(mc_inst.getOpcode());
138766902a32SVedant Kumar
138866902a32SVedant Kumar // Treat software auth traps (brk 0xc470 + aut key, where 0x70 == 'p', 0xc4
138966902a32SVedant Kumar // == 'a' + 'c') as authenticated instructions for reporting purposes, in
139066902a32SVedant Kumar // addition to the standard authenticated instructions specified in ARMv8.3.
139166902a32SVedant Kumar bool IsBrkC47x = false;
139266902a32SVedant Kumar if (InstrDesc.isTrap() && mc_inst.getNumOperands() == 1) {
139366902a32SVedant Kumar const llvm::MCOperand &Op0 = mc_inst.getOperand(0);
139466902a32SVedant Kumar if (Op0.isImm() && Op0.getImm() >= 0xc470 && Op0.getImm() <= 0xc474)
139566902a32SVedant Kumar IsBrkC47x = true;
139666902a32SVedant Kumar }
139766902a32SVedant Kumar
139866902a32SVedant Kumar return InstrDesc.isAuthenticated() || IsBrkC47x;
139966902a32SVedant Kumar }
140066902a32SVedant Kumar
DisassemblerLLVMC(const ArchSpec & arch,const char * flavor_string)1401be960424SJonas Devlieghere DisassemblerLLVMC::DisassemblerLLVMC(const ArchSpec &arch,
1402be960424SJonas Devlieghere const char *flavor_string)
1403be960424SJonas Devlieghere : Disassembler(arch, flavor_string), m_exe_ctx(nullptr), m_inst(nullptr),
14047150b562SJason Molenda m_data_from_file(false), m_adrp_address(LLDB_INVALID_ADDRESS),
14057150b562SJason Molenda m_adrp_insn() {
1406be960424SJonas Devlieghere if (!FlavorValidForArchSpec(arch, m_flavor.c_str())) {
1407be960424SJonas Devlieghere m_flavor.assign("default");
1408be960424SJonas Devlieghere }
1409be960424SJonas Devlieghere
1410be960424SJonas Devlieghere unsigned flavor = ~0U;
1411be960424SJonas Devlieghere llvm::Triple triple = arch.GetTriple();
1412be960424SJonas Devlieghere
1413be960424SJonas Devlieghere // So far the only supported flavor is "intel" on x86. The base class will
1414be960424SJonas Devlieghere // set this correctly coming in.
1415be960424SJonas Devlieghere if (triple.getArch() == llvm::Triple::x86 ||
1416be960424SJonas Devlieghere triple.getArch() == llvm::Triple::x86_64) {
1417be960424SJonas Devlieghere if (m_flavor == "intel") {
1418be960424SJonas Devlieghere flavor = 1;
1419be960424SJonas Devlieghere } else if (m_flavor == "att") {
1420be960424SJonas Devlieghere flavor = 0;
1421be960424SJonas Devlieghere }
1422be960424SJonas Devlieghere }
1423be960424SJonas Devlieghere
1424be960424SJonas Devlieghere ArchSpec thumb_arch(arch);
1425be960424SJonas Devlieghere if (triple.getArch() == llvm::Triple::arm) {
1426be960424SJonas Devlieghere std::string thumb_arch_name(thumb_arch.GetTriple().getArchName().str());
1427be960424SJonas Devlieghere // Replace "arm" with "thumb" so we get all thumb variants correct
1428be960424SJonas Devlieghere if (thumb_arch_name.size() > 3) {
1429be960424SJonas Devlieghere thumb_arch_name.erase(0, 3);
1430be960424SJonas Devlieghere thumb_arch_name.insert(0, "thumb");
1431be960424SJonas Devlieghere } else {
1432d1c124e6SDavid Spickett thumb_arch_name = "thumbv9.3a";
1433be960424SJonas Devlieghere }
1434be960424SJonas Devlieghere thumb_arch.GetTriple().setArchName(llvm::StringRef(thumb_arch_name));
1435be960424SJonas Devlieghere }
1436be960424SJonas Devlieghere
1437be960424SJonas Devlieghere // If no sub architecture specified then use the most recent arm architecture
1438d1c124e6SDavid Spickett // so the disassembler will return all instructions. Without it we will see a
1439d1c124e6SDavid Spickett // lot of unknown opcodes if the code uses instructions which are not
1440d1c124e6SDavid Spickett // available in the oldest arm version (which is used when no sub architecture
1441d1c124e6SDavid Spickett // is specified).
1442be960424SJonas Devlieghere if (triple.getArch() == llvm::Triple::arm &&
1443be960424SJonas Devlieghere triple.getSubArch() == llvm::Triple::NoSubArch)
1444d1c124e6SDavid Spickett triple.setArchName("armv9.3a");
1445be960424SJonas Devlieghere
14460542d152SKazu Hirata std::string features_str;
1447be960424SJonas Devlieghere const char *triple_str = triple.getTriple().c_str();
1448be960424SJonas Devlieghere
1449be960424SJonas Devlieghere // ARM Cortex M0-M7 devices only execute thumb instructions
1450be960424SJonas Devlieghere if (arch.IsAlwaysThumbInstructions()) {
1451be960424SJonas Devlieghere triple_str = thumb_arch.GetTriple().getTriple().c_str();
1452be960424SJonas Devlieghere features_str += "+fp-armv8,";
1453be960424SJonas Devlieghere }
1454be960424SJonas Devlieghere
1455be960424SJonas Devlieghere const char *cpu = "";
1456be960424SJonas Devlieghere
1457be960424SJonas Devlieghere switch (arch.GetCore()) {
1458be960424SJonas Devlieghere case ArchSpec::eCore_mips32:
1459be960424SJonas Devlieghere case ArchSpec::eCore_mips32el:
1460be960424SJonas Devlieghere cpu = "mips32";
1461be960424SJonas Devlieghere break;
1462be960424SJonas Devlieghere case ArchSpec::eCore_mips32r2:
1463be960424SJonas Devlieghere case ArchSpec::eCore_mips32r2el:
1464be960424SJonas Devlieghere cpu = "mips32r2";
1465be960424SJonas Devlieghere break;
1466be960424SJonas Devlieghere case ArchSpec::eCore_mips32r3:
1467be960424SJonas Devlieghere case ArchSpec::eCore_mips32r3el:
1468be960424SJonas Devlieghere cpu = "mips32r3";
1469be960424SJonas Devlieghere break;
1470be960424SJonas Devlieghere case ArchSpec::eCore_mips32r5:
1471be960424SJonas Devlieghere case ArchSpec::eCore_mips32r5el:
1472be960424SJonas Devlieghere cpu = "mips32r5";
1473be960424SJonas Devlieghere break;
1474be960424SJonas Devlieghere case ArchSpec::eCore_mips32r6:
1475be960424SJonas Devlieghere case ArchSpec::eCore_mips32r6el:
1476be960424SJonas Devlieghere cpu = "mips32r6";
1477be960424SJonas Devlieghere break;
1478be960424SJonas Devlieghere case ArchSpec::eCore_mips64:
1479be960424SJonas Devlieghere case ArchSpec::eCore_mips64el:
1480be960424SJonas Devlieghere cpu = "mips64";
1481be960424SJonas Devlieghere break;
1482be960424SJonas Devlieghere case ArchSpec::eCore_mips64r2:
1483be960424SJonas Devlieghere case ArchSpec::eCore_mips64r2el:
1484be960424SJonas Devlieghere cpu = "mips64r2";
1485be960424SJonas Devlieghere break;
1486be960424SJonas Devlieghere case ArchSpec::eCore_mips64r3:
1487be960424SJonas Devlieghere case ArchSpec::eCore_mips64r3el:
1488be960424SJonas Devlieghere cpu = "mips64r3";
1489be960424SJonas Devlieghere break;
1490be960424SJonas Devlieghere case ArchSpec::eCore_mips64r5:
1491be960424SJonas Devlieghere case ArchSpec::eCore_mips64r5el:
1492be960424SJonas Devlieghere cpu = "mips64r5";
1493be960424SJonas Devlieghere break;
1494be960424SJonas Devlieghere case ArchSpec::eCore_mips64r6:
1495be960424SJonas Devlieghere case ArchSpec::eCore_mips64r6el:
1496be960424SJonas Devlieghere cpu = "mips64r6";
1497be960424SJonas Devlieghere break;
1498be960424SJonas Devlieghere default:
1499be960424SJonas Devlieghere cpu = "";
1500be960424SJonas Devlieghere break;
1501be960424SJonas Devlieghere }
1502be960424SJonas Devlieghere
1503be960424SJonas Devlieghere if (arch.IsMIPS()) {
1504be960424SJonas Devlieghere uint32_t arch_flags = arch.GetFlags();
1505be960424SJonas Devlieghere if (arch_flags & ArchSpec::eMIPSAse_msa)
1506be960424SJonas Devlieghere features_str += "+msa,";
1507be960424SJonas Devlieghere if (arch_flags & ArchSpec::eMIPSAse_dsp)
1508be960424SJonas Devlieghere features_str += "+dsp,";
1509be960424SJonas Devlieghere if (arch_flags & ArchSpec::eMIPSAse_dspr2)
1510be960424SJonas Devlieghere features_str += "+dspr2,";
1511be960424SJonas Devlieghere }
1512be960424SJonas Devlieghere
15130231a90bSDavid Spickett // If any AArch64 variant, enable latest ISA with all extensions.
1514801c7866SDavid Spickett if (triple.isAArch64()) {
1515e5fdcfacSDavid Spickett features_str += "+all,";
1516be960424SJonas Devlieghere
1517801c7866SDavid Spickett if (triple.getVendor() == llvm::Triple::Apple)
1518be960424SJonas Devlieghere cpu = "apple-latest";
1519be960424SJonas Devlieghere }
1520be960424SJonas Devlieghere
1521c6042076SSaleem Abdulrasool if (triple.isRISCV()) {
1522c6042076SSaleem Abdulrasool uint32_t arch_flags = arch.GetFlags();
1523c6042076SSaleem Abdulrasool if (arch_flags & ArchSpec::eRISCV_rvc)
1524c6042076SSaleem Abdulrasool features_str += "+c,";
1525c6042076SSaleem Abdulrasool if (arch_flags & ArchSpec::eRISCV_rve)
1526c6042076SSaleem Abdulrasool features_str += "+e,";
1527c6042076SSaleem Abdulrasool if ((arch_flags & ArchSpec::eRISCV_float_abi_single) ==
1528c6042076SSaleem Abdulrasool ArchSpec::eRISCV_float_abi_single)
1529c6042076SSaleem Abdulrasool features_str += "+f,";
1530c6042076SSaleem Abdulrasool if ((arch_flags & ArchSpec::eRISCV_float_abi_double) ==
1531c6042076SSaleem Abdulrasool ArchSpec::eRISCV_float_abi_double)
1532c6042076SSaleem Abdulrasool features_str += "+f,+d,";
1533c6042076SSaleem Abdulrasool if ((arch_flags & ArchSpec::eRISCV_float_abi_quad) ==
1534c6042076SSaleem Abdulrasool ArchSpec::eRISCV_float_abi_quad)
1535c6042076SSaleem Abdulrasool features_str += "+f,+d,+q,";
1536c6042076SSaleem Abdulrasool // FIXME: how do we detect features such as `+a`, `+m`?
1537c6042076SSaleem Abdulrasool }
1538c6042076SSaleem Abdulrasool
1539be960424SJonas Devlieghere // We use m_disasm_up.get() to tell whether we are valid or not, so if this
1540be960424SJonas Devlieghere // isn't good for some reason, we won't be valid and FindPlugin will fail and
1541be960424SJonas Devlieghere // we won't get used.
1542be960424SJonas Devlieghere m_disasm_up = MCDisasmInstance::Create(triple_str, cpu, features_str.c_str(),
1543be960424SJonas Devlieghere flavor, *this);
1544be960424SJonas Devlieghere
1545be960424SJonas Devlieghere llvm::Triple::ArchType llvm_arch = triple.getArch();
1546be960424SJonas Devlieghere
1547be960424SJonas Devlieghere // For arm CPUs that can execute arm or thumb instructions, also create a
1548be960424SJonas Devlieghere // thumb instruction disassembler.
1549be960424SJonas Devlieghere if (llvm_arch == llvm::Triple::arm) {
1550be960424SJonas Devlieghere std::string thumb_triple(thumb_arch.GetTriple().getTriple());
1551be960424SJonas Devlieghere m_alternate_disasm_up =
1552be960424SJonas Devlieghere MCDisasmInstance::Create(thumb_triple.c_str(), "", features_str.c_str(),
1553be960424SJonas Devlieghere flavor, *this);
1554be960424SJonas Devlieghere if (!m_alternate_disasm_up)
1555be960424SJonas Devlieghere m_disasm_up.reset();
1556be960424SJonas Devlieghere
1557be960424SJonas Devlieghere } else if (arch.IsMIPS()) {
1558be960424SJonas Devlieghere /* Create alternate disassembler for MIPS16 and microMIPS */
1559be960424SJonas Devlieghere uint32_t arch_flags = arch.GetFlags();
1560be960424SJonas Devlieghere if (arch_flags & ArchSpec::eMIPSAse_mips16)
1561be960424SJonas Devlieghere features_str += "+mips16,";
1562be960424SJonas Devlieghere else if (arch_flags & ArchSpec::eMIPSAse_micromips)
1563be960424SJonas Devlieghere features_str += "+micromips,";
1564be960424SJonas Devlieghere
1565be960424SJonas Devlieghere m_alternate_disasm_up = MCDisasmInstance::Create(
1566be960424SJonas Devlieghere triple_str, cpu, features_str.c_str(), flavor, *this);
1567be960424SJonas Devlieghere if (!m_alternate_disasm_up)
1568be960424SJonas Devlieghere m_disasm_up.reset();
1569be960424SJonas Devlieghere }
1570be960424SJonas Devlieghere }
1571be960424SJonas Devlieghere
1572be960424SJonas Devlieghere DisassemblerLLVMC::~DisassemblerLLVMC() = default;
1573be960424SJonas Devlieghere
CreateInstance(const ArchSpec & arch,const char * flavor)1574be960424SJonas Devlieghere Disassembler *DisassemblerLLVMC::CreateInstance(const ArchSpec &arch,
1575be960424SJonas Devlieghere const char *flavor) {
1576be960424SJonas Devlieghere if (arch.GetTriple().getArch() != llvm::Triple::UnknownArch) {
1577be960424SJonas Devlieghere std::unique_ptr<DisassemblerLLVMC> disasm_up(
1578be960424SJonas Devlieghere new DisassemblerLLVMC(arch, flavor));
1579be960424SJonas Devlieghere
1580be960424SJonas Devlieghere if (disasm_up.get() && disasm_up->IsValid())
1581be960424SJonas Devlieghere return disasm_up.release();
1582be960424SJonas Devlieghere }
1583be960424SJonas Devlieghere return nullptr;
1584be960424SJonas Devlieghere }
1585be960424SJonas Devlieghere
DecodeInstructions(const Address & base_addr,const DataExtractor & data,lldb::offset_t data_offset,size_t num_instructions,bool append,bool data_from_file)1586be960424SJonas Devlieghere size_t DisassemblerLLVMC::DecodeInstructions(const Address &base_addr,
1587be960424SJonas Devlieghere const DataExtractor &data,
1588be960424SJonas Devlieghere lldb::offset_t data_offset,
1589be960424SJonas Devlieghere size_t num_instructions,
1590be960424SJonas Devlieghere bool append, bool data_from_file) {
1591be960424SJonas Devlieghere if (!append)
1592be960424SJonas Devlieghere m_instruction_list.Clear();
1593be960424SJonas Devlieghere
1594be960424SJonas Devlieghere if (!IsValid())
1595be960424SJonas Devlieghere return 0;
1596be960424SJonas Devlieghere
1597be960424SJonas Devlieghere m_data_from_file = data_from_file;
1598be960424SJonas Devlieghere uint32_t data_cursor = data_offset;
1599be960424SJonas Devlieghere const size_t data_byte_size = data.GetByteSize();
1600be960424SJonas Devlieghere uint32_t instructions_parsed = 0;
1601be960424SJonas Devlieghere Address inst_addr(base_addr);
1602be960424SJonas Devlieghere
1603be960424SJonas Devlieghere while (data_cursor < data_byte_size &&
1604be960424SJonas Devlieghere instructions_parsed < num_instructions) {
1605be960424SJonas Devlieghere
1606be960424SJonas Devlieghere AddressClass address_class = AddressClass::eCode;
1607be960424SJonas Devlieghere
1608be960424SJonas Devlieghere if (m_alternate_disasm_up)
1609be960424SJonas Devlieghere address_class = inst_addr.GetAddressClass();
1610be960424SJonas Devlieghere
1611be960424SJonas Devlieghere InstructionSP inst_sp(
1612be960424SJonas Devlieghere new InstructionLLVMC(*this, inst_addr, address_class));
1613be960424SJonas Devlieghere
1614be960424SJonas Devlieghere if (!inst_sp)
1615be960424SJonas Devlieghere break;
1616be960424SJonas Devlieghere
1617be960424SJonas Devlieghere uint32_t inst_size = inst_sp->Decode(*this, data, data_cursor);
1618be960424SJonas Devlieghere
1619be960424SJonas Devlieghere if (inst_size == 0)
1620be960424SJonas Devlieghere break;
1621be960424SJonas Devlieghere
1622be960424SJonas Devlieghere m_instruction_list.Append(inst_sp);
1623be960424SJonas Devlieghere data_cursor += inst_size;
1624be960424SJonas Devlieghere inst_addr.Slide(inst_size);
1625be960424SJonas Devlieghere instructions_parsed++;
1626be960424SJonas Devlieghere }
1627be960424SJonas Devlieghere
1628be960424SJonas Devlieghere return data_cursor - data_offset;
1629be960424SJonas Devlieghere }
1630be960424SJonas Devlieghere
Initialize()1631be960424SJonas Devlieghere void DisassemblerLLVMC::Initialize() {
1632be960424SJonas Devlieghere PluginManager::RegisterPlugin(GetPluginNameStatic(),
1633be960424SJonas Devlieghere "Disassembler that uses LLVM MC to disassemble "
1634be960424SJonas Devlieghere "i386, x86_64, ARM, and ARM64.",
1635be960424SJonas Devlieghere CreateInstance);
1636be960424SJonas Devlieghere
1637be960424SJonas Devlieghere llvm::InitializeAllTargetInfos();
1638be960424SJonas Devlieghere llvm::InitializeAllTargetMCs();
1639be960424SJonas Devlieghere llvm::InitializeAllAsmParsers();
1640be960424SJonas Devlieghere llvm::InitializeAllDisassemblers();
1641be960424SJonas Devlieghere }
1642be960424SJonas Devlieghere
Terminate()1643be960424SJonas Devlieghere void DisassemblerLLVMC::Terminate() {
1644be960424SJonas Devlieghere PluginManager::UnregisterPlugin(CreateInstance);
1645be960424SJonas Devlieghere }
1646be960424SJonas Devlieghere
OpInfoCallback(void * disassembler,uint64_t pc,uint64_t offset,uint64_t size,int tag_type,void * tag_bug)1647be960424SJonas Devlieghere int DisassemblerLLVMC::OpInfoCallback(void *disassembler, uint64_t pc,
1648be960424SJonas Devlieghere uint64_t offset, uint64_t size,
1649be960424SJonas Devlieghere int tag_type, void *tag_bug) {
1650be960424SJonas Devlieghere return static_cast<DisassemblerLLVMC *>(disassembler)
1651be960424SJonas Devlieghere ->OpInfo(pc, offset, size, tag_type, tag_bug);
1652be960424SJonas Devlieghere }
1653be960424SJonas Devlieghere
SymbolLookupCallback(void * disassembler,uint64_t value,uint64_t * type,uint64_t pc,const char ** name)1654be960424SJonas Devlieghere const char *DisassemblerLLVMC::SymbolLookupCallback(void *disassembler,
1655be960424SJonas Devlieghere uint64_t value,
1656be960424SJonas Devlieghere uint64_t *type, uint64_t pc,
1657be960424SJonas Devlieghere const char **name) {
1658be960424SJonas Devlieghere return static_cast<DisassemblerLLVMC *>(disassembler)
1659be960424SJonas Devlieghere ->SymbolLookup(value, type, pc, name);
1660be960424SJonas Devlieghere }
1661be960424SJonas Devlieghere
FlavorValidForArchSpec(const lldb_private::ArchSpec & arch,const char * flavor)1662be960424SJonas Devlieghere bool DisassemblerLLVMC::FlavorValidForArchSpec(
1663be960424SJonas Devlieghere const lldb_private::ArchSpec &arch, const char *flavor) {
1664be960424SJonas Devlieghere llvm::Triple triple = arch.GetTriple();
1665be960424SJonas Devlieghere if (flavor == nullptr || strcmp(flavor, "default") == 0)
1666be960424SJonas Devlieghere return true;
1667be960424SJonas Devlieghere
1668be960424SJonas Devlieghere if (triple.getArch() == llvm::Triple::x86 ||
1669be960424SJonas Devlieghere triple.getArch() == llvm::Triple::x86_64) {
1670be960424SJonas Devlieghere return strcmp(flavor, "intel") == 0 || strcmp(flavor, "att") == 0;
1671be960424SJonas Devlieghere } else
1672be960424SJonas Devlieghere return false;
1673be960424SJonas Devlieghere }
1674be960424SJonas Devlieghere
IsValid() const1675be960424SJonas Devlieghere bool DisassemblerLLVMC::IsValid() const { return m_disasm_up.operator bool(); }
1676be960424SJonas Devlieghere
OpInfo(uint64_t PC,uint64_t Offset,uint64_t Size,int tag_type,void * tag_bug)1677be960424SJonas Devlieghere int DisassemblerLLVMC::OpInfo(uint64_t PC, uint64_t Offset, uint64_t Size,
1678be960424SJonas Devlieghere int tag_type, void *tag_bug) {
1679be960424SJonas Devlieghere switch (tag_type) {
1680be960424SJonas Devlieghere default:
1681be960424SJonas Devlieghere break;
1682be960424SJonas Devlieghere case 1:
1683be960424SJonas Devlieghere memset(tag_bug, 0, sizeof(::LLVMOpInfo1));
1684be960424SJonas Devlieghere break;
1685be960424SJonas Devlieghere }
1686be960424SJonas Devlieghere return 0;
1687be960424SJonas Devlieghere }
1688be960424SJonas Devlieghere
SymbolLookup(uint64_t value,uint64_t * type_ptr,uint64_t pc,const char ** name)1689be960424SJonas Devlieghere const char *DisassemblerLLVMC::SymbolLookup(uint64_t value, uint64_t *type_ptr,
1690be960424SJonas Devlieghere uint64_t pc, const char **name) {
1691be960424SJonas Devlieghere if (*type_ptr) {
1692be960424SJonas Devlieghere if (m_exe_ctx && m_inst) {
1693be960424SJonas Devlieghere // std::string remove_this_prior_to_checkin;
1694be960424SJonas Devlieghere Target *target = m_exe_ctx ? m_exe_ctx->GetTargetPtr() : nullptr;
1695be960424SJonas Devlieghere Address value_so_addr;
1696be960424SJonas Devlieghere Address pc_so_addr;
16977150b562SJason Molenda if (target->GetArchitecture().GetMachine() == llvm::Triple::aarch64 ||
16987150b562SJason Molenda target->GetArchitecture().GetMachine() == llvm::Triple::aarch64_be ||
16997150b562SJason Molenda target->GetArchitecture().GetMachine() == llvm::Triple::aarch64_32) {
17007150b562SJason Molenda if (*type_ptr == LLVMDisassembler_ReferenceType_In_ARM64_ADRP) {
17017150b562SJason Molenda m_adrp_address = pc;
17027150b562SJason Molenda m_adrp_insn = value;
17037150b562SJason Molenda *name = nullptr;
17047150b562SJason Molenda *type_ptr = LLVMDisassembler_ReferenceType_InOut_None;
17057150b562SJason Molenda return nullptr;
17067150b562SJason Molenda }
17077150b562SJason Molenda // If this instruction is an ADD and
17087150b562SJason Molenda // the previous instruction was an ADRP and
17097150b562SJason Molenda // the ADRP's register and this ADD's register are the same,
17107150b562SJason Molenda // then this is a pc-relative address calculation.
17117150b562SJason Molenda if (*type_ptr == LLVMDisassembler_ReferenceType_In_ARM64_ADDXri &&
171296d1b4ddSKazu Hirata m_adrp_insn && m_adrp_address == pc - 4 &&
17135cff5142SKazu Hirata (m_adrp_insn.value() & 0x1f) == ((value >> 5) & 0x1f)) {
17147150b562SJason Molenda uint32_t addxri_inst;
17157150b562SJason Molenda uint64_t adrp_imm, addxri_imm;
17167150b562SJason Molenda // Get immlo and immhi bits, OR them together to get the ADRP imm
17177150b562SJason Molenda // value.
17185cff5142SKazu Hirata adrp_imm = ((m_adrp_insn.value() & 0x00ffffe0) >> 3) |
17195cff5142SKazu Hirata ((m_adrp_insn.value() >> 29) & 0x3);
17207150b562SJason Molenda // if high bit of immhi after right-shifting set, sign extend
17217150b562SJason Molenda if (adrp_imm & (1ULL << 20))
17227150b562SJason Molenda adrp_imm |= ~((1ULL << 21) - 1);
17237150b562SJason Molenda
17247150b562SJason Molenda addxri_inst = value;
17257150b562SJason Molenda addxri_imm = (addxri_inst >> 10) & 0xfff;
17267150b562SJason Molenda // check if 'sh' bit is set, shift imm value up if so
17277150b562SJason Molenda // (this would make no sense, ADRP already gave us this part)
17287150b562SJason Molenda if ((addxri_inst >> (12 + 5 + 5)) & 1)
17297150b562SJason Molenda addxri_imm <<= 12;
17307150b562SJason Molenda value = (m_adrp_address & 0xfffffffffffff000LL) + (adrp_imm << 12) +
17317150b562SJason Molenda addxri_imm;
17327150b562SJason Molenda }
17337150b562SJason Molenda m_adrp_address = LLDB_INVALID_ADDRESS;
17347150b562SJason Molenda m_adrp_insn.reset();
17357150b562SJason Molenda }
17367150b562SJason Molenda
1737be960424SJonas Devlieghere if (m_inst->UsingFileAddress()) {
1738be960424SJonas Devlieghere ModuleSP module_sp(m_inst->GetAddress().GetModule());
1739be960424SJonas Devlieghere if (module_sp) {
1740be960424SJonas Devlieghere module_sp->ResolveFileAddress(value, value_so_addr);
1741be960424SJonas Devlieghere module_sp->ResolveFileAddress(pc, pc_so_addr);
1742be960424SJonas Devlieghere }
1743be960424SJonas Devlieghere } else if (target && !target->GetSectionLoadList().IsEmpty()) {
1744be960424SJonas Devlieghere target->GetSectionLoadList().ResolveLoadAddress(value, value_so_addr);
1745be960424SJonas Devlieghere target->GetSectionLoadList().ResolveLoadAddress(pc, pc_so_addr);
1746be960424SJonas Devlieghere }
1747be960424SJonas Devlieghere
1748be960424SJonas Devlieghere SymbolContext sym_ctx;
1749be960424SJonas Devlieghere const SymbolContextItem resolve_scope =
1750be960424SJonas Devlieghere eSymbolContextFunction | eSymbolContextSymbol;
1751be960424SJonas Devlieghere if (pc_so_addr.IsValid() && pc_so_addr.GetModule()) {
1752be960424SJonas Devlieghere pc_so_addr.GetModule()->ResolveSymbolContextForAddress(
1753be960424SJonas Devlieghere pc_so_addr, resolve_scope, sym_ctx);
1754be960424SJonas Devlieghere }
1755be960424SJonas Devlieghere
1756be960424SJonas Devlieghere if (value_so_addr.IsValid() && value_so_addr.GetSection()) {
1757be960424SJonas Devlieghere StreamString ss;
1758be960424SJonas Devlieghere
1759be960424SJonas Devlieghere bool format_omitting_current_func_name = false;
1760be960424SJonas Devlieghere if (sym_ctx.symbol || sym_ctx.function) {
1761be960424SJonas Devlieghere AddressRange range;
1762be960424SJonas Devlieghere if (sym_ctx.GetAddressRange(resolve_scope, 0, false, range) &&
1763be960424SJonas Devlieghere range.GetBaseAddress().IsValid() &&
1764be960424SJonas Devlieghere range.ContainsLoadAddress(value_so_addr, target)) {
1765be960424SJonas Devlieghere format_omitting_current_func_name = true;
1766be960424SJonas Devlieghere }
1767be960424SJonas Devlieghere }
1768be960424SJonas Devlieghere
1769be960424SJonas Devlieghere // If the "value" address (the target address we're symbolicating) is
1770be960424SJonas Devlieghere // inside the same SymbolContext as the current instruction pc
1771be960424SJonas Devlieghere // (pc_so_addr), don't print the full function name - just print it
1772be960424SJonas Devlieghere // with DumpStyleNoFunctionName style, e.g. "<+36>".
1773be960424SJonas Devlieghere if (format_omitting_current_func_name) {
1774be960424SJonas Devlieghere value_so_addr.Dump(&ss, target, Address::DumpStyleNoFunctionName,
1775be960424SJonas Devlieghere Address::DumpStyleSectionNameOffset);
1776be960424SJonas Devlieghere } else {
1777be960424SJonas Devlieghere value_so_addr.Dump(
1778be960424SJonas Devlieghere &ss, target,
1779be960424SJonas Devlieghere Address::DumpStyleResolvedDescriptionNoFunctionArguments,
1780be960424SJonas Devlieghere Address::DumpStyleSectionNameOffset);
1781be960424SJonas Devlieghere }
1782be960424SJonas Devlieghere
1783be960424SJonas Devlieghere if (!ss.GetString().empty()) {
1784be960424SJonas Devlieghere // If Address::Dump returned a multi-line description, most commonly
1785be960424SJonas Devlieghere // seen when we have multiple levels of inlined functions at an
1786be960424SJonas Devlieghere // address, only show the first line.
1787adcd0268SBenjamin Kramer std::string str = std::string(ss.GetString());
1788be960424SJonas Devlieghere size_t first_eol_char = str.find_first_of("\r\n");
1789be960424SJonas Devlieghere if (first_eol_char != std::string::npos) {
1790be960424SJonas Devlieghere str.erase(first_eol_char);
1791be960424SJonas Devlieghere }
1792be960424SJonas Devlieghere m_inst->AppendComment(str);
1793be960424SJonas Devlieghere }
1794be960424SJonas Devlieghere }
1795be960424SJonas Devlieghere }
1796be960424SJonas Devlieghere }
1797be960424SJonas Devlieghere
17987150b562SJason Molenda // TODO: llvm-objdump sets the type_ptr to the
17997150b562SJason Molenda // LLVMDisassembler_ReferenceType_Out_* values
18007150b562SJason Molenda // based on where value_so_addr is pointing, with
18017150b562SJason Molenda // Mach-O specific augmentations in MachODump.cpp. e.g.
18027150b562SJason Molenda // see what AArch64ExternalSymbolizer::tryAddingSymbolicOperand
18037150b562SJason Molenda // handles.
1804be960424SJonas Devlieghere *type_ptr = LLVMDisassembler_ReferenceType_InOut_None;
1805be960424SJonas Devlieghere *name = nullptr;
1806be960424SJonas Devlieghere return nullptr;
1807be960424SJonas Devlieghere }
1808